Kemungkinan dari Regresi Logistik

8

Saya telah membangun model regresi logistik dalam R dan meskipun hasilnya tampaknya memuaskan sampai taraf tertentu, ada satu pertanyaan yang belum dapat saya atasi. Saya tidak yakin apakah pendekatan saya sama sekali benar.

Saya tahu bahwa tujuan keseluruhan model logistik adalah untuk memprediksi probabilitas keberhasilan untuk variabel acak biner. Dari model logistik yang sama, mungkinkah mengetahui probabilitas untuk proporsi tertentu? Misalnya, kita tertarik untuk mencari kemungkinan diterima di sekolah, dan kami menggunakan regresi logistik untuk memperkirakan probabilitas itu, yang jelas akan tergantung pada beberapa variabel independen. Pertanyaan saya adalah dengan model yang sama, apakah mungkin untuk memperkirakan proporsi siswa yang akan diterima di sekolah tersebut?

Saya telah mencoba menggunakan probabilitas Binomial untuk menjawabnya, tetapi untuk beberapa alasan itu tidak memberi saya jawaban yang benar. Bagaimana saya melakukannya? Jika kita mengetahui probabilitas keberhasilan, maka kita juga tahu bahwa variabel Dependen mengikuti Distribusi Binomial dengan Parameter N dan P, di mana N adalah Jumlah percobaan dan P adalah probabilitas keberhasilan yang dapat diperkirakan dari model logistik. Jadi jika saya ingin probabilitas bahwa proporsinya kurang atau sama dengan mengatakan p maka saya pikir ini setara dengan probabilitas bahwa dalam uji coba N ada lebih sedikit atau sama dengan keberhasilan N * p dengan probabilitas keberhasilan menjadi P.

PS Saya tahu bahwa probabilitas keberhasilan adalah tingkat / proporsi keseluruhan tetapi yang saya minati adalah mengetahui probabilitas untuk kelompok tertentu. Karakteristik kelompok dapat dimasukkan dalam model tetapi itu akan membatasi dalam kasus saya. Sebenarnya saya lebih tertarik untuk mencari kemungkinan proporsi dari model logistik daripada keberhasilan kelompok tertentu.

Terima kasih

ThinkStatsme
sumber
7
Jika saya memahami pertanyaan ini, ia bertanya bagaimana menggunakan model logistik untuk memperkirakan distribusi jumlah siswa yang diterima dari kumpulan pelamar tertentu. Hasil seperti itu dapat diperoleh , tetapi jika Anda tertarik untuk menerapkannya, maka mungkin membantu untuk mempertimbangkan beberapa asumsi yang mungkin dilanggar. Khususnya, perhitungan hasil itu harus mengasumsikan bahwa penerimaan satu orang tidak akan memengaruhi peluang penerimaan orang lain. Jika sekolah memiliki kuota untuk jenis pelamar tertentu, itu tidak akan menjadi masalah, misalnya.
whuber
@whuber, Sebagian saya ingin memperkirakan jumlah siswa yang diterima dari kumpulan pelamar tertentu. Juga lebih menarik meskipun saya mungkin tidak mengutarakannya dengan benar, apakah mungkin untuk menetapkan probabilitas pada estimasi tingkat keberhasilan rata-rata dari model logistik. Misalnya, jika estimasi keberhasilan untuk suatu kasus adalah 85%, apakah ada cara untuk mengetahui probabilitas bahwa ini bisa dikatakan kurang dari 60%? Apakah ini masuk akal sekarang? Saya pikir mungkin saya bisa menggunakan kesalahan standar pada prediksi untuk menjawab itu, apakah itu benar?
ThinkStatsme

Jawaban:

1

Jika saya memahami pertanyaan Anda dengan benar, Anda telah memperkirakan probabilitas untuk setiap individu, tetapi ingin tahu probabilitas rata-rata dari segmen individu tersebut? Misalnya Anda memiliki 1000 orang dengan tingkat rata-rata 65% tetapi hanya 300 yang memiliki mata biru, berapakah tingkat rata-rata mereka yang memiliki mata biru? Maka Anda bisa memperkirakan probabilitas yang diperkirakan untuk mereka yang memiliki mata biru.

Josh
sumber