Saya menggunakan tanda sisipan untuk menjalankan hutan acak lintas divalidasi atas dataset. Variabel Y adalah faktor. Tidak ada NaN, Inf, atau NA di dataset saya. Namun ketika menjalankan hutan acak, saya mengerti
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
In addition: There were 28 warnings (use warnings() to see them)
Warning messages:
1: In data.matrix(x) : NAs introduced by coercion
2: In data.matrix(x) : NAs introduced by coercion
3: In data.matrix(x) : NAs introduced by coercion
4: In data.matrix(x) : NAs introduced by coercion
Apakah ada yang punya ide apakah kesalahan ini disebabkan oleh NA yang diperkenalkan oleh paksaan? Jika demikian, bagaimana saya bisa mencegah paksaan seperti itu?
r
random-forest
caret
regression
prediction
fitting
social-science
poisson-distribution
distributions
characteristic-function
bayesian
prior
regression
normal-distribution
interaction
nonparametric
skewness
svm
standard-deviation
standard-error
regression-coefficients
igraph
natural-language
word2vec
word-embeddings
regression
machine-learning
sampling
r
regression
machine-learning
random-forest
ensemble
sampling
unbiased-estimator
proof
estimators
mse
probability
conditional-probability
bayes
anova
missing-data
neural-networks
recommender-system
r
confidence-interval
sample
multiple-imputation
r
time-series
forecasting
mase
Info5ek
sumber
sumber
Mungkin penyebabnya adalah Anda memiliki beberapa variabel karakter dalam bingkai data Anda.
Ubah semua variabel karakter menjadi faktor dalam satu baris:
library(dplyr) data_fac=data_char %>% mutate_if(is.character, as.factor)
sumber
mutate_if()
untuk menggunakan ini ... terima kasih!Seperti yang ditunjukkan dalam peringatan ada 28 kesalahan yang terjadi adalah jumlah kolom dengan tipe data karakter ("chr"). Memaksa kolom-kolom ini pada faktor-faktor yang memungkinkan untuk memulai.
sumber