Estou usando o sinal de intercalação para executar uma floresta aleatória validada cruzada em um conjunto de dados. A variável Y é um fator. Não há NaN, Inf ou NA no meu conjunto de dados. No entanto, ao executar a floresta aleatória, recebo
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
In addition: There were 28 warnings (use warnings() to see them)
Warning messages:
1: In data.matrix(x) : NAs introduced by coercion
2: In data.matrix(x) : NAs introduced by coercion
3: In data.matrix(x) : NAs introduced by coercion
4: In data.matrix(x) : NAs introduced by coercion
Alguém tem ideias sobre se esse erro é causado pelas NAs introduzidas pela coerção? Se sim, como posso evitar essa coerção?
r
random-forest
caret
regression
prediction
fitting
social-science
poisson-distribution
distributions
characteristic-function
bayesian
prior
regression
normal-distribution
interaction
nonparametric
skewness
svm
standard-deviation
standard-error
regression-coefficients
igraph
natural-language
word2vec
word-embeddings
regression
machine-learning
sampling
r
regression
machine-learning
random-forest
ensemble
sampling
unbiased-estimator
proof
estimators
mse
probability
conditional-probability
bayes
anova
missing-data
neural-networks
recommender-system
r
confidence-interval
sample
multiple-imputation
r
time-series
forecasting
mase
Info5ek
fonte
fonte
Provavelmente, a causa é que você tem algumas variáveis de caracteres em seu quadro de dados.
Converta todas as variáveis de caracteres em fator em uma linha:
library(dplyr) data_fac=data_char %>% mutate_if(is.character, as.factor)
fonte
mutate_if()
para isso ... obrigado!Conforme mostrado no aviso, ocorreram 28 erros, que eram o número de colunas com tipos de dados de caracteres ("chr"). Forçar essas colunas a fatores permitidos para o início da execução.
fonte