Makalah ini mengklaim bahwa dalam CART, karena pemisahan biner dilakukan pada kovariat tunggal pada setiap langkah, semua pemisahan bersifat ortogonal dan oleh karena itu interaksi di antara kovariat tidak dipertimbangkan.
Namun, banyak referensi yang sangat serius mengklaim, sebaliknya, bahwa struktur hierarki pohon menjamin bahwa interaksi antara para prediktor secara otomatis dimodelkan (misalnya, makalah ini , dan tentu saja Hastie).
Siapa yang benar Apakah pohon yang ditanamkan CART menangkap interaksi di antara variabel input?
Jawaban:
sumber
Jawaban singkat
CARTs membutuhkan bantuan untuk menangkap interaksi.
Jawaban panjang
Ambil algoritma serakah yang tepat (Chen dan Guestrin, 2016):
Rerata pada daun akan menjadi harapan bersyarat, tetapi setiap perpecahan dalam perjalanan ke daun tidak tergantung pada yang lain. Jika Fitur A tidak penting dengan sendirinya tetapi itu penting dalam interaksi dengan Fitur B, algoritma tidak akan terpecah pada Fitur A. Tanpa pemisahan ini, algoritma tidak dapat melihat pemisahan pada Fitur B, yang diperlukan untuk menghasilkan interaksi.
Dengan banyak fitur, regularisasi, dan batas keras pada jumlah pemisahan, algoritma yang sama dapat menghilangkan interaksi.
Penanganan masalah
Interaksi eksplisit sebagai fitur baru
Contoh dari Zhang ("Memenangkan Kompetisi Sains Data", 2015):
Algoritma pohon yang tidak serakah
Dalam pertanyaan lain, Simone menyarankan algoritma berbasis lookahead dan pohon keputusan miring .
Pendekatan pembelajaran yang berbeda
Beberapa metode pembelajaran menangani interaksi dengan lebih baik.
Berikut adalah tabel dari The Elements of Statistics Learning (baris "Kemampuan untuk mengekstrak kombinasi linear fitur"):
sumber