Interpretasi Pseudo-R2 McFadden

29

Saya memiliki model regresi logistik biner dengan pseudo R-kuadrat McFadden dari 0,192 dengan variabel dependen yang disebut pembayaran (1 = pembayaran dan 0 = tidak ada pembayaran). Apa interpretasi pseudo R-squared ini?

Apakah ini perbandingan relatif untuk model bersarang (misalnya model 6 variabel memiliki pseudo R-kuadrat McFadden sebesar 0,192, sedangkan model variabel 5 (setelah menghapus satu variabel dari model variabel 6 yang disebutkan sebelumnya), model 5 variabel ini memiliki pseudo R -dibandingkan dengan 0,131. Apakah kita ingin mempertahankan variabel ke-6 dalam model?) atau apakah itu kuantitas absolut (misalnya model tertentu yang memiliki pseudo R-kuadrat McFadden dari 0,192 lebih baik daripada model yang ada dengan pseudo McFadden R-squared dari 0,180 (bahkan untuk model yang tidak bersarang)? Ini hanya cara yang mungkin untuk melihat pseudo R-squared McFadden; namun, saya berasumsi dua pandangan ini jauh, sehingga alasan mengapa saya mengajukan pertanyaan ini di sini.

Saya telah melakukan banyak penelitian tentang topik ini, dan saya belum menemukan jawaban yang saya cari dalam hal mampu menafsirkan pseudo R-kuadrat McFadden dari 0,192. Setiap wawasan dan / atau referensi sangat dihargai! Sebelum menjawab pertanyaan ini, saya menyadari bahwa ini bukan ukuran terbaik untuk menggambarkan model regresi logistik, tetapi saya ingin memiliki pemahaman yang lebih besar tentang statistik ini!

Matt Reichenbach
sumber

Jawaban:

34

Jadi saya pikir saya akan menyimpulkan apa yang telah saya pelajari tentang pseudo R2 McFadden sebagai jawaban yang tepat.

Referensi seminal yang dapat saya lihat untuk pseudo R2 McFadden adalah: McFadden, D. (1974) "Analisis logit bersyarat dari perilaku pilihan kualitatif." Hal. 105-142 di P. Zarembka (ed.), Frontiers in Econometrics. Pers Akademik. http://eml.berkeley.edu/~mcfadden/travel.html Gambar 5.5 menunjukkan hubungan antara rho-squared dan ukuran R2 tradisional dari OLS. Interpretasi saya adalah bahwa nilai yang lebih besar dari rho-squared (pseudo R2 McFadden) lebih baik daripada yang lebih kecil.

Interpretasi pseudo R2 McFadden antara 0,2-0,4 berasal dari bab buku yang dia kontribusikan kepada: Bahvioural Travel Modeling. Diedit oleh David Hensher dan Peter Stopher. 1979. McFadden menyumbang Ch. 15 "Metode Kuantitatif untuk Menganalisis Perilaku Perjalanan pada Individu: Beberapa Perkembangan Terkini". Diskusi evaluasi model (dalam konteks model login multinomial) dimulai pada halaman 306 di mana ia memperkenalkan rho-squared (pseudo R2 McFadden). McFadden menyatakan "sementara indeks R2 adalah konsep yang lebih akrab bagi perencana yang berpengalaman dalam OLS, itu tidak berperilaku baik sebagai ukuran rho-squared, untuk estimasi ML. Mereka yang tidak terbiasa dengan rho-squared harus diperingatkan sebelumnya bahwa nilainya cenderung menjadi jauh lebih rendah daripada indeks R2 ... Misalnya, nilai 0,2 hingga 0,4 untuk rho-kuadrat mewakili kecocokan SANGAT BAIK.

Jadi pada dasarnya, rho-squared dapat diartikan seperti R2, tetapi jangan berharap itu menjadi sebesar. Dan nilai dari 0,2-0,4 menunjukkan (dalam kata-kata McFadden) model yang sangat baik cocok.

Chris
sumber
Bungkus yang bagus, Chris. Terima kasih untuk usaha Anda!
Matt Reichenbach
Saya datang terlambat ke diskusi, tetapi saya akan meninggalkan tautan ini di mana mereka menjelaskan R2 MacFadden dibandingkan dengan langkah-langkah penyesuaian lainnya: statisticshorizons.com/r2logistic
sergiouribe
13

McFadden's R squared didefinisikan sebagai 1-l_mod / l_null, di mana l_mod adalah nilai kemungkinan log untuk model pas dan l_null adalah kemungkinan log untuk model nol yang hanya menyertakan intersep sebagai prediktor (sehingga setiap individu diprediksi memiliki probabilitas yang sama) dari 'kesuksesan').

Untuk model regresi logistik, nilai kemungkinan log selalu negatif (karena kontribusi kemungkinan dari setiap pengamatan adalah probabilitas antara 0 dan 1). Jika model Anda tidak benar-benar memprediksi hasil yang lebih baik daripada model nol, l_mod tidak akan jauh lebih besar dari l_null, sehingga l_mod / l_null kira-kira 1, dan McFadden's R kuadrat mendekati 0 (model Anda tidak memiliki nilai prediktif) .

Sebaliknya jika model Anda benar-benar baik, orang-orang dengan hasil (1) yang sukses akan memiliki probabilitas yang pas mendekati 1, dan sebaliknya bagi mereka dengan hasil (0) yang gagal. Dalam hal ini jika Anda menjalani perhitungan kemungkinan kontribusi kemungkinan dari setiap individu untuk model Anda akan mendekati nol, sehingga l_mod mendekati nol, dan McFadden's R kuadrat mendekati 1, menunjukkan kemampuan prediksi yang sangat baik.

Mengenai apa yang dapat dianggap sebagai nilai yang baik, pandangan pribadi saya adalah bahwa seperti pertanyaan serupa dalam statistik (misalnya apa yang merupakan korelasi besar?), Apakah itu tidak pernah menjadi jawaban yang pasti. Tahun lalu saya menulis posting blog tentang McFadden's R kuadrat dalam regresi logistik, yang memiliki beberapa ilustrasi simulasi lebih lanjut.

Jonathan Bartlett
sumber
5

Saya melakukan penelitian yang lebih fokus pada topik ini, dan saya menemukan bahwa interpretasi pseudo R-kuadrat McFadden (juga dikenal sebagai indeks rasio kemungkinan) tidak jelas; namun, dapat berkisar dari 0 hingga 1, tetapi tidak akan pernah mencapai atau melebihi 1 sebagai hasil perhitungannya.

Aturan praktis yang saya temukan sangat membantu adalah bahwa pseudo R-kuadrat McFadden mulai dari 0,2 hingga 0,4 menunjukkan model yang sangat cocok. Dengan demikian, model yang disebutkan di atas dengan pseudo R-kuadrat McFadden dari 0,192 kemungkinan bukan model yang mengerikan, setidaknya dengan metrik ini, tetapi juga tidak terlalu kuat.

Penting juga untuk dicatat bahwa pseudo R-squared McFadden paling baik digunakan untuk membandingkan spesifikasi berbeda dari model yang sama (yaitu model bersarang). Mengacu pada contoh tersebut, model 6 variabel (pseudo R-kuadrat McFadden = 0,192) cocok dengan data lebih baik daripada model variabel 5 (pseudo R-kuadrat McFadden = 0,131), yang saya uji secara formal menggunakan uji rasio log-likelihood , yang menunjukkan ada perbedaan yang signifikan ( p <0,001) antara dua model, dan dengan demikian model 6 variabel lebih disukai untuk dataset yang diberikan.

Matt Reichenbach
sumber
1
Apa referensi yang Anda temukan yang mengklaim R2 McFadden antara 0,2 - 0,4 cocok?
Chris
Btw ... di sini adalah referensi dan tautan ke artikel McFadden asli di mana ia mendefinisikan ukuran pseudo-R2-nya. McFadden, D. (1974) "Analisis logit bersyarat dari perilaku pilihan kualitatif." Pp. 105-142 di P. Zarembka (ed.), Frontiers in Econometrics. Pers Akademik. elsa.berkeley.edu/reprints/mcfadden/zarembka.pdf
Chris
1
Terima kasih untuk referensi. Tampaknya banyak pekerjaan McFadden dapat ditemukan di situs webnya di Berkeley. Di bawah ini adalah tautan ke seluruh buku yang Anda kutip di atas: elsa.berkeley.edu/users/mcfadden/travel.html Semua bab muncul sebagai PDF. Rho-square (pseudo R2 McFadden) disebutkan dalam Bab 5. Halaman 122 dan seterusnya (lihat persamaan 5.33 dan grafik yang mengikuti segera setelahnya). Saya tidak melihat penyebutan 0,2-0,4 = "VG model fit". Saya akan terus mencari penampilan mani dari "aturan praktis" ini. Terima kasih atas bantuan Anda!
Chris
1
Tidak masalah! Saya menghargai keingintahuan dan ketelitian Anda. Ungkapan yang tepat dapat ditemukan di lifesciencesite.com/lsj/life1002/… , di mana penulis menyatakan "A good-of-fit menggunakan pseudo r-square (ρ2) McFadden digunakan untuk menyesuaikan model keseluruhan. McFadden menyarankan ρ2 nilai antara 0,2 dan 0,4 harus diambil untuk mewakili kecocokan yang sangat baik dari model (Louviere et al., 2000). "
Matt Reichenbach
4
Lembaga saya memiliki salinan elektronik Louviere et al (2000). "Metode Pilihan Lain: Analisis dan Aplikasi". Cambridge University Press. Ini adalah referensi yang Lee (Life Science Journal) kutip untuk rho-squared di {0.2-0.4} = "VG fit". Pada halaman 55 dari Louviere (terkait dengan persamaan 3.32) kita melihat kutipan berikut: "Nilai rho-squared antara 0,2-0,4 dianggap sebagai indikasi model yang sangat baik cocok. Simulasi oleh Domenich dan McFadden (1975) ekivalen kisaran ini untuk 0,7 hingga 0,9 untuk fungsi linier ".
Chris
4

Jika ada orang yang masih tertarik untuk menemukan kata-kata McFadden sendiri, inilah tautannya. Dalam catatan kaki, McFadden (1977, p.35) menulis bahwa "nilai .2 hingga .4 untuk [ ] mewakili kecocokan yang sangat baik." Makalah ini tersedia online.ρ2

http://cowles.yale.edu/sites/default/files/files/pub/d04/d0474.pdf

Yiran
sumber