Misalkan kita memiliki model regresi logistik:
Diberikan sampel acak dengan ukuran , kita dapat menghitung interval kepercayaan untuk dan interval prediksi yang sesuai untuk , dengan nilai tertentu dari vektor prediktor. Ini semua sangat standar dan terperinci, misalnya, di sini .
Andaikan saya tertarik pada interval prediksi untuk , diberikan . Tentu saja, sama sekali tidak masuk akal untuk menghitung interval prediksi untuk realisasi tunggal , karena hanya dapat mengambil nilai 0 dan 1, dan tidak ada nilai di antaranya. Namun , jika kita mempertimbangkan realisasi untuk nilai tetap sama dari , maka ini menjadi mirip (tapi tidak identik) dengan pertanyaan tentang komputasi interval prediksi untuk variabel acak binomial . Ini pada dasarnya situasi yang sama dijelaskan oleh Glen_b dalam komentar untuk jawaban ini. Apakah pertanyaan ini memiliki jawaban, selain dari yang sepele "gunakan bootparap nonparametrik"?
sumber
Jawaban:
Salah satu cara ini harus bekerja tanpa bootstrap (yang dalam praktiknya mungkin merupakan hal tercepat yang diterapkan), adalah:
Atau, seseorang dapat "hanya" mengintegrasikan log-odds dari prediksi gabungan hasil dan log-odds, tapi saya percaya itu akan menjadi kekacauan total tanpa solusi bentuk tertutup.
sumber