Saya bahkan tidak yakin bahwa pertanyaan itu masuk akal, tapi saya pikir saya melihat beberapa judul makalah di mana mereka mengusulkan hutan acak dengan efek acak. Apakah ini mungkin di R?
r
random-forest
random-effects-model
mguzmann
sumber
sumber
Jawaban:
Mereka tidak umum digunakan bersama-sama, dan harus diperhatikan sebelum menggabungkannya.
Hutan acak biasanya digunakan sebagai pengklasifikasi. Alasan Anda akan menggunakan hutan acak alih-alih metode lain (misalnya K-means clustering) adalah bahwa Anda mungkin memiliki banyak dimensi yang ingin Anda klasifikasikan. Masalah dengan jumlah dimensi yang besar adalah bahwa jika Anda ingin menguji semua kombinasi urutan dimensi, Anda akan memiliki sejumlah besar pilihan (itu tumbuh lebih cepat daripada jumlah dimensi faktorial).
Efek acak biasanya digunakan dalam regresi dengan tindakan berulang untuk hal yang sama. Mereka umumnya digunakan dalam model efek campuran di mana istilah campuran mengacu pada efek tetap dan acak. Efek tetap dianggap mewakili parameter yang akan Anda lihat lagi (misalnya obat atau usia seseorang). Efek acak dianggap mewakili contoh variabilitas di sekitar parameter yang tidak akan Anda lihat lagi (misalnya orang tertentu).
Ada contoh menggunakannya bersama-sama ketika ada data cluster http://dx.doi.org/10.1080/00949655.2012.741599 dan http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Saya tidak mengetahui adanya paket R yang dapat melakukan analisis ini.
sumber
Ya itu mungkin. Anda harus memeriksa " RE-EM Trees: Pendekatan Penambangan Data untuk Data Longitudinal dan Clustered ," dan paket R terkait REEMtree .
Sudah lama sejak saya melihat kertas. Saya ingat penulis belum mencoba membentuk ansambel pohon-pohon ini, tetapi tidak ada yang menyarankan itu tidak berhasil.
sumber
Efek Campuran Random Forests (MERFs) adalah suatu hal. Seperti yang dinyatakan di atas, ada beberapa penelitian hebat tentang mereka oleh kelompok Dr. Larocque di HEC Montreal. Makalahnya ada di sini: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Pada dasarnya ini adalah cara yang logis secara teoritis untuk menggabungkan pemodelan non-linear hutan acak dengan efek acak linier.
Kami baru saja merilis paket open source dengan Python yang mengimplementasikan MERF menggunakan algoritma di atas di koran.
Kami menulis posting blog terperinci tentang paket dan bagaimana menggunakannya untuk kumpulan data yang dikelompokkan.
sumber