Saya menemukan formula untuk pseudo dalam buku Extending the Linear Model with R, Julian J. Faraway (hlm. 59).
Apakah ini formula umum untuk pseudo untuk GLM?
sumber
Saya menemukan formula untuk pseudo dalam buku Extending the Linear Model with R, Julian J. Faraway (hlm. 59).
Apakah ini formula umum untuk pseudo untuk GLM?
Ada sejumlah besar pseudo- s untuk GLiMs. Situs bantuan statistik UCLA yang sangat baik memiliki tinjauan umum yang komprehensif di sini . Yang Anda daftarkan disebut pseudo- McFadden . Relatif dengan tipologi UCLA, itu seperti dalam arti bahwa indeks peningkatan model yang dipasang di atas model nol. Beberapa perangkat lunak statistik, terutama SPSS, jika saya ingat dengan benar, mencetak pseudo- McFadden secara default dengan hasil dari beberapa analisis seperti regresi logistik, jadi saya menduga ini cukup umum, meskipun Cox & Snell dan Nagelkerke pseudo- s mungkin lebih dari itu. Namun, pseudo- McFadden tidak memiliki semua properti (tidak ada pseudo- tidak). Jika seseorang tertarik menggunakan pseudo- untuk memahami suatu model, saya sangat merekomendasikan membaca thread CV yang luar biasa ini: Ukuran pseudo- manakah yang harus dilaporkan untuk regresi logistik (Cox & Snell atau Nagelkerke)? (Untuk apa nilainya, itu sendiri lebih licin daripada yang disadari orang, sebuah demonstrasi besar yang dapat dilihat pada jawaban @ whuber di sini: Apakah bermanfaat atau berbahaya? ) R 2 R 2 R 2 R 2
Colin Cameron, A., & Windmeijer, F. A. (1997). An R-squared measure of goodness of fit for some common nonlinear regression models. Journal of Econometrics, 77(2), 329-342.
R memberikan null dan sisa penyimpangan dalam output
glm
sehingga Anda dapat membuat perbandingan semacam ini (lihat dua baris terakhir di bawah).Anda juga dapat menarik nilai-nilai ini dari objek dengan
model$null.deviance
danmodel$deviance
sumber
summary.glm
Rumus yang Anda usulkan telah diusulkan oleh Maddala (1983) dan Magee (1990) untuk memperkirakan R kuadrat pada model logistik. Karena itu saya tidak berpikir itu berlaku untuk semua model glm (lihat buku Metode Regresi Modern oleh Thomas P. Ryan di halaman 266).
Jika Anda membuat kumpulan data palsu, Anda akan melihat bahwa itu meremehkan R kuadrat ... untuk gaussian glm sebagai contoh.
Saya pikir untuk gaussian glm Anda dapat menggunakan rumus kuadrat dasar (lm) ...
Dan untuk logistik (atau keluarga binomial dalam r) saya akan menggunakan rumus yang Anda usulkan ...
Sejauh ini untuk poisson glm saya telah menggunakan persamaan dari posting ini.
https://stackoverflow.com/questions/23067475/how-do-i-obtain-pseudo-r2-measures-in-stata-when-using-glm-regress
Ada juga artikel bagus tentang pseudo R2 yang tersedia di gerbang penelitian ... di sini adalah tautannya:
https://www.researchgate.net/publication/222802021_Pseudo_R-squared_measures_for_Poisson_regress_models_with_over-_or_underdispersion
Saya harap ini membantu.
sumber
1-summary(GLM)$deviance/summary(GLM)$null.deviance
dan Anda akan melihat bahwa R2 tidak cocok dengan nilai R2 dari regresi OLS biasa, sehingga jawaban di atas benar! Lihat juga posting saya di sini - stats.stackexchange.com/questions/412580/…Paket R
modEvA
menghitung D-Squared sebagai1 - (mod$deviance/mod$null.deviance)
seperti yang disebutkan oleh David J. HarrisD-Squared atau menjelaskan Penyimpangan model diperkenalkan pada (Guisan & Zimmermann 2000) https://doi.org/10.1016/S0304-3800(00)00354-9
sumber