Beberapa posting (di sini dan di sini ) menunjukkan bahwa regresi beta lebih tepat ketika variabel dependen secara alami dibatasi antara 0 dan 1. Pertanyaan saya adalah, mengesampingkan kesesuaian, apakah secara teknis tidak tepat untuk memasukkan regresi logistik ke variabel respons proporsional? R akan memberikan peringatan tetapi masih membuahkan hasil.
Sepertinya saya bahwa fungsi kemungkinan tidak akan menjadi kemungkinan yang valid ketika variabel respon proporsional bukan biner, tetapi secara matematis, masih dapat diminimalkan untuk memberikan solusi. Saya bertanya-tanya pelanggaran / kesalahan apa, jika ada, yang dilakukan ketika menyesuaikan regresi logistik ke data proporsional.
regression
logistic
proportion
Komunitas
sumber
sumber
Jawaban:
Apa yang Anda usulkan kadang-kadang disebut log fraksional. Ini tentu memiliki kelebihan, asalkan Anda ingat untuk menggunakan kesalahan standar yang kuat. Pada tahun 2010 saya memberikan ceramah di pertemuan Pengguna Stata Jerman membandingkan antara lain regresi beta dan logit fraksional. Slide dapat ditemukan di sini: http://www.maartenbuis.nl/presentations/berlin10.pdf
sumber
weights
argumen untukglm
), lihat misalnya di sini stats.stackexchange.com/a/26779/28666 . Bagaimana "log fraksional" dengan "kesalahan standar yang kuat" berhubungan dengan pendekatan ini? Apakah sama atau tidak?Model semacam ini sering didefinisikan dan digunakan sebagai salah satu jenis model linier umum. Untuk satu ulasan ringkas, lihat http://www.stata-journal.com/article.html?article=st0147 Argumennya adalah bahwa binomial adalah keluarga yang masuk akal bahkan untuk proporsi terus menerus karena varians juga akan mendekati 0 sebagai pendekatan rata-rata 0 atau 1.
Apakah program atau fungsi tertentu dalam perangkat lunak tertentu mengakomodasi mereka adalah masalah yang berbeda. Untuk mengatakan bahwa "R akan memberikan peringatan tetapi masih membuahkan hasil" menyampaikan sedikit informasi. Paket mana yang Anda maksud? Apakah ini satu-satunya paket yang relevan? Dalam kasus apa pun, seperti yang ditunjukkan oleh artikel yang dirujuk, model ini didukung dengan baik di Stata, misalnya.
Itu masih menyisakan ruang untuk diskusi rinci tentang manfaat relatif dari model logit untuk proporsi berkelanjutan dan regresi beta.
sumber