Saya mencoba memperkirakan model pilihan pekerjaan dengan tiga pilihan. Adakah alternatif untuk menggunakan regresi logistik multinomial ketika menangani hasil kategorikal yang tidak berurutan seperti itu?
Ketika berhadapan dengan variabel dependen biner tampaknya ada beberapa pilihan seperti model LPM serta model probit dan logit biner. Ketika berhadapan dengan variabel kategori tidak teratur, literatur tetap merekomendasikan model multinomial logit tanpa membandingkannya dengan alternatif.
Jawaban:
Ada berbagai model yang tersedia untuk memodelkan model multinomial.
Saya merekomendasikan Cameron & Trivedi Microeconometrics Menggunakan Stata untuk perkenalan yang mudah dan luar biasa atau lihat Slide Kuliah Imbens & Wooldridge atau di sini yang tersedia online.
Model yang banyak digunakan meliputi:
regresi logistik multinomial atau mlogit di Stata
logit kondisional multinomial (memungkinkan untuk dengan mudah memasukkan tidak hanya prediktor individu-spesifik tetapi juga pilihan-spesifik) atau asclogit di Stata
nested logit (mengendurkan independensi dari asumsi alternatif yang tidak relevan (IIA) dengan mengelompokkan / memberi peringkat pada pilihan secara hierarkis) atau nlogit di Stata
mixed logit (melonggarkan asumsi IIA dengan mengasumsikan misalnya parameter berdistribusi normal) atau mixlogit di Stata.
model probit multinomial (lebih jauh dapat mengendurkan asumsi IIA tetapi Anda harus memiliki prediktor spesifik-pilihan tersedia) logit campuran (melonggarkan asumsi IIA dengan asumsi misalnya parameter terdistribusi normal), gunakan asmprobit di Stata (mprobit tidak memungkinkan untuk menggunakan prediktor pilihan-spesifik tetapi Anda harus menggunakannya untuk mengendurkan asumsi IIA )
sumber
Jika Anda menginginkan opsi yang sangat berbeda dari regresi logistik, Anda bisa menggunakan jaring saraf. Sebagai contoh,
nnet
paket R memilikimultinom
fungsi. Atau Anda bisa menggunakan Hutan Acak (randomForest
paket R , dan lainnya). Dan ada beberapa alternatif Pembelajaran Mesin lainnya, meskipun opsi seperti SVM cenderung tidak dikalibrasi dengan baik yang membuat output mereka lebih rendah - menurut saya - dengan regresi logistik.[Sebenarnya, logit mungkin sedang digunakan di bawah tenda oleh neuron di jaringan saraf. Jadi itu sangat berbeda, tetapi tidak jauh berbeda pada saat yang bersamaan.]
sumber
Juga, pikirkan Neural Nets (dengan aktivasi softmax), Decision Trees (atau Random Forests) tidak memerlukan asumsi IIA dipenuhi mengingat tidak dapat diandalkannya tes ini berkaitan dengan memeriksa asumsi IIA. Jadi ini mungkin keuntungan dibandingkan dengan logistik multinomial jika semua yang kami khawatirkan hanyalah prediksi.
Atau, beberapa model logistik dapat dibangun untuk kategori K-1 dengan kategori Kth sebagai referensi. Ini juga memungkinkan untuk prediktor yang berbeda untuk dicolokkan untuk masing-masing persamaan berbeda dengan multinomial
sumber