Saya telah membangun model regresi logistik dalam R dan meskipun hasilnya tampaknya memuaskan sampai taraf tertentu, ada satu pertanyaan yang belum dapat saya atasi. Saya tidak yakin apakah pendekatan saya sama sekali benar.
Saya tahu bahwa tujuan keseluruhan model logistik adalah untuk memprediksi probabilitas keberhasilan untuk variabel acak biner. Dari model logistik yang sama, mungkinkah mengetahui probabilitas untuk proporsi tertentu? Misalnya, kita tertarik untuk mencari kemungkinan diterima di sekolah, dan kami menggunakan regresi logistik untuk memperkirakan probabilitas itu, yang jelas akan tergantung pada beberapa variabel independen. Pertanyaan saya adalah dengan model yang sama, apakah mungkin untuk memperkirakan proporsi siswa yang akan diterima di sekolah tersebut?
Saya telah mencoba menggunakan probabilitas Binomial untuk menjawabnya, tetapi untuk beberapa alasan itu tidak memberi saya jawaban yang benar. Bagaimana saya melakukannya? Jika kita mengetahui probabilitas keberhasilan, maka kita juga tahu bahwa variabel Dependen mengikuti Distribusi Binomial dengan Parameter N dan P, di mana N adalah Jumlah percobaan dan P adalah probabilitas keberhasilan yang dapat diperkirakan dari model logistik. Jadi jika saya ingin probabilitas bahwa proporsinya kurang atau sama dengan mengatakan p maka saya pikir ini setara dengan probabilitas bahwa dalam uji coba N ada lebih sedikit atau sama dengan keberhasilan N * p dengan probabilitas keberhasilan menjadi P.
PS Saya tahu bahwa probabilitas keberhasilan adalah tingkat / proporsi keseluruhan tetapi yang saya minati adalah mengetahui probabilitas untuk kelompok tertentu. Karakteristik kelompok dapat dimasukkan dalam model tetapi itu akan membatasi dalam kasus saya. Sebenarnya saya lebih tertarik untuk mencari kemungkinan proporsi dari model logistik daripada keberhasilan kelompok tertentu.
Terima kasih
sumber
Jawaban:
Jika saya memahami pertanyaan Anda dengan benar, Anda telah memperkirakan probabilitas untuk setiap individu, tetapi ingin tahu probabilitas rata-rata dari segmen individu tersebut? Misalnya Anda memiliki 1000 orang dengan tingkat rata-rata 65% tetapi hanya 300 yang memiliki mata biru, berapakah tingkat rata-rata mereka yang memiliki mata biru? Maka Anda bisa memperkirakan probabilitas yang diperkirakan untuk mereka yang memiliki mata biru.
sumber