Saya merujuk pada pertanyaan dan jawabannya: Bagaimana cara membandingkan (kemungkinan) kemampuan prediksi model yang dikembangkan dari regresi logistik? oleh @Clark Chong dan jawaban / komentar oleh @ Frank Harrell. dan untuk pertanyaan Derajat kebebasan dalam tes Hosmer-Lemeshow dan komentar-komentarnya.
Saya telah membaca makalah DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "Sebuah perbandingan tes good-of-fit untuk model regresi Logistik", Statistics in Medicine, Vol. 16, 965-980 (1997) .
Setelah membaca saya bingung karena pertanyaan yang saya ajukan bertanya secara eksplisit untuk "(kemungkinan) kemampuan prediktif", yang menurut saya tidak sama dengan apa yang baik-baik-cocok-tes dalam makalah supra bertujuan:
Seperti yang kita ketahui, regresi logistik mengasumsikan hubungan berbentuk S antara variabel penjelas dan probabilitas keberhasilan, bentuk fungsional untuk bentuk S adalah
Tanpa berpura-pura bahwa tidak ada kekurangan dengan tes Hosmer-Lemeshow, saya pikir kita harus membedakan antara tes untuk kemampuan prediksi (a) '(probabilitas) ' dan (b) ' good-of-fit '.
Tujuan former adalah untuk menguji apakah probabilitas diprediksi dengan baik, sedangkan tes good-of-fit menguji apakah fungsi berbentuk S di atas adalah fungsi 'benar'. Lebih formal:
- tes untuk 'tes kemampuan prediktif probabilitas' memiliki menyatakan bahwa probabilitas keberhasilan diprediksi dengan baik oleh model;
- sedangkan untuk uji -of-fit adalah (lihat Hosmer et. al.) bahwa bentuk fungsional supra S adalah yang benar. Hosmer et al. melakukan simulasi di mana mereka menemukan kekuatan untuk mendeteksi dua jenis penyimpangan dari nol yaitu bahwa fungsi tautan salah atau bahwa eksponen dalam penyebut tidak linier.
Jelas, jika fungsi di atas memiliki bentuk fungsional 'benar' (jadi jika tes menyimpulkan bahwa kita dapat menerima untuk goodness-of-fit), maka probabilitas yang diprediksi akan baik-baik saja, ...
Komentar pertama
... Namun, menerima adalah kesimpulan yang lemah seperti yang dijelaskan dalam Apa yang terjadi jika kita gagal menolak hipotesis nol? .
Pertanyaan pertama
Pertanyaan / komentar paling penting yang saya miliki adalah bahwa jika kebaikan ditolak, maka kesimpulan dari tes ini adalah bahwa bentuk fungsional bukan yang 'benar', namun, apakah ini menyiratkan bahwa probabilitasnya adalah tidak diprediksi dengan baik?
Pertanyaan kedua
Selanjutnya, saya ingin menunjukkan kesimpulan Hosmer et. Al; (Saya mengutip dari abstrak):
'' Pemeriksaan kinerja tes ketika model yang benar memiliki istilah kuadrat tetapi model yang hanya berisi istilah linier telah sesuai menunjukkan bahwa Pearson chi-square, jumlah kuadrat-kuadrat yang tidak tertimbang, dekile Hosmer-Lemeshow risiko, jumlah sisa kuadrat yang dihaluskan dan tes skor Stukel, memiliki kekuatan melebihi 50 persen untuk mendeteksi keberangkatan moderat dari linieritas ketika ukuran sampel 100 dan memiliki kekuatan lebih dari 90 persen untuk alternatif yang sama untuk sampel ukuran 500 Semua tes tidak memiliki kekuatan ketika model yang tepat memiliki interaksi antara dikotomis dan kontinu kovariat tetapi hanya model kovariat kontinyu yang cocok. Kekuatan untuk mendeteksi tautan yang ditentukan secara spesifik buruk untuk sampel berukuran 100. Untuk sampel berukuran 500 Stukel ' Tes skor memiliki kekuatan terbaik tetapi hanya melebihi 50 persen untuk mendeteksi fungsi tautan asimetris. Kekuatan dari tes jumlah-kuadrat tidak tertimbang untuk mendeteksi fungsi tautan yang ditentukan secara salah sedikit kurang dari tes skor Stukel ''
Dapatkah saya menyimpulkan dari tes ini yang memiliki kekuatan lebih atau bahwa Hosmer – Lemeshow memiliki daya lebih kecil (untuk mendeteksi anomali spesifik ini)?
Komentar kedua
Makalah oleh Hosmer et. Al. yang saya sebut supra, menghitung (mensimulasikan) kekuatan untuk mendeteksi anomali tertentu (kekuatan hanya dapat dihitung jika ditentukan). Apakah menurut saya ini tidak menyiratkan bahwa hasil ini dapat digeneralisasi ke '' semua alternatif yang mungkin ''?H 1
sumber