Hampir setiap contoh pohon keputusan yang saya temui kebetulan merupakan pohon biner. Apakah ini cukup universal? Apakah sebagian besar algoritma standar (C4.5, CART, dll.) Hanya mendukung pohon biner? Dari apa yang saya kumpulkan, CHAID tidak terbatas pada pohon biner, tapi itu sepertinya pengecualian.
Perpecahan dua arah diikuti oleh perpecahan dua arah lain pada salah satu anak tidak sama dengan perpecahan tiga arah tunggal. Ini mungkin poin akademis, tapi saya berusaha memastikan saya memahami kasus penggunaan yang paling umum.
sumber
Saya tidak yakin apa yang Anda maksud di sini. Setiap split multi-arah dapat direpresentasikan sebagai serangkaian split dua arah. Untuk pemisahan tiga arah, Anda dapat membagi menjadi A, B, dan C dengan terlebih dahulu membelah menjadi A&B versus C dan kemudian memisahkan A dari B.
Algoritme yang diberikan mungkin tidak memilih urutan tertentu (terutama jika, seperti kebanyakan algoritma, itu serakah), tetapi tentu saja bisa. Dan jika ada prosedur pengacakan atau stagewise yang dilakukan seperti di hutan acak atau pohon yang dikuatkan, peluang untuk menemukan urutan pemisahan yang tepat akan meningkat. Seperti yang telah ditunjukkan oleh orang lain, pemisahan multi-arah secara komputasi mahal, sehingga diberikan alternatif ini, sebagian besar peneliti tampaknya telah memilih pemisahan biner.
Semoga ini membantu
sumber
Mengenai penggunaan pohon keputusan dan pemisahan (biner versus lainnya), saya hanya tahu CHAID yang memiliki pemisahan non-biner tetapi ada kemungkinan yang lain. Bagi saya, penggunaan utama dari pemisahan non-biner adalah dalam latihan penambangan data di mana saya melihat bagaimana cara secara optimal memasukkan variabel nominal dengan banyak level. Serangkaian pemisahan biner tidak berguna seperti pengelompokan yang dilakukan oleh CHAID.
sumber
Silakan baca ini
sumber