Saya memiliki masalah regresi di mana hasilnya tidak sepenuhnya 0, 1 melainkan dalam kisaran semua bilangan real dari 0 hingga 1 termasuk .
Masalah ini sudah dibahas di utas ini , meskipun pertanyaan saya sedikit berbeda.
Saya tidak dapat menggunakan regresi linier untuk alasan yang sama dengan regresi logistik yang biasanya digunakan. Dalam regresi linier A) nilai-nilai IV yang sangat besar akan condongkan hasil yang diprediksi menjadi 1 dan B) hasil regresi linier tidak dibatasi ke batas 0,1.
Melihat fungsi biaya logistik ini dari buku teks saya Saya mengetahui bahwa persamaan ini dirancang untuk menghitung biaya lebih besar dari 0 hanya ketika dan tidak memiliki nilai yang sama 0 atau 1.
Apakah mungkin untuk menggunakan regresi logistik dengan memodifikasi fungsi biaya untuk mengukur semua kesalahan hipotesis?
sumber
glm()
fungsi yang dilakukan R saat diberi respons kontinu danfamily=quasibinomial
? Apakah itu akan memperkirakan koefisien denganfamily=binomial
dan kemudian, dalam langkah tambahan, menghitung kesalahan standar dengan mengambil-dispersi ke dalam akun? Jika ya, apakah ini sama dengan komputasi "kesalahan standar yang kuat"? Saya memiliki beberapa data yang sesuai dan saya mencoba kedua keluarga denganglm
; Saya mendapatkan koefisien identik tetapi berbeda kesalahan standar. Terima kasih.Ketika Y dibatasi, beta-regresi sering kali masuk akal; lihat kertas "Pemeras Lemon Lebih Baik"
Ini memungkinkan efek lantai dan langit-langit; itu juga memungkinkan untuk memodelkan varians serta mean.
sumber
Karena y tidak sepenuhnya nol atau satu (seperti yang Anda katakan) biaya harus selalu lebih besar dari nol. Jadi, saya rasa Anda tidak perlu modifikasi dalam model.
sumber
Saya menyarankan dua model alternatif:
Jika hasil Anda (variabel y) dipesan, cobalah model Probit Dipesan.
Jika hasil Anda (variabel y) tidak dipesan, coba model Multinomial Logit.
sumber