Metode ansambel berbasis pohon seperti Hutan Acak, dan turunan berikutnya (misalnya, hutan kondisional), semua dimaksudkan untuk berguna dalam apa yang disebut masalah "kecil n , p besar ", untuk mengidentifikasi kepentingan variabel relatif. Memang, ini tampaknya menjadi masalah, tetapi pertanyaan saya adalah seberapa jauh kemampuan ini dapat diambil? Bisakah satu, misalnya 30 pengamatan dan 100 variabel? Apa yang menjadi titik tolak pendekatan semacam itu, dan adakah aturan praktis yang layak yang ada? Saya lebih suka dan akan menerima jawaban yang didukung oleh tautan ke bukti aktual (bukan dugaan), menggunakan set data simulasi atau nyata. Saya belum menemukan banyak tentang yang terakhir (di sini dan di sini), jadi saran / saran / saran Anda (pada topik) dipersilahkan!
sumber