Jika Hosmer-Lemeshow menunjukkan kurangnya kecocokan tetapi AIC adalah yang terendah di antara semua model .... haruskah Anda masih menggunakan model itu?
Jika saya menghapus suatu variabel, statistik Hosmer-Lemeshow tidak signifikan (yang berarti tidak ada kecocokan yang kurang). Tetapi AIC meningkat.
Sunting : Saya pikir secara umum, jika AIC dari model yang berbeda dekat (yaitu ) satu sama lain maka mereka pada dasarnya sama. Tapi AIC jauh berbeda. Ini tampaknya menunjukkan bahwa yang memiliki AIC terendah adalah yang harus saya gunakan walaupun tes Hosmer-Lemeshow menunjukkan sebaliknya.
Mungkin juga tes HL hanya berlaku untuk sampel besar? Ini memiliki daya rendah untuk ukuran sampel kecil (ukuran sampel saya ~ 300). Tetapi jika saya mendapatkan hasil yang signifikan ... Ini berarti bahwa bahkan dengan daya rendah saya mendapat penolakan.
Apakah ada bedanya jika saya menggunakan AICc versus AIC? Bagaimana Anda mendapatkan AICc di SAS? Saya tahu mungkin ada masalah dengan multiplisitas. Tapi apriori I berhipotesis bahwa variabel memiliki efek pada hasil.
Ada komentar?
Sunting2 : Saya pikir saya harus menggunakan model dengan satu variabel lebih sedikit dan AIC lebih tinggi dengan HL tidak signifikan. Alasannya adalah karena dua variabel berkorelasi satu sama lain. Jadi menyingkirkan seseorang itu masuk akal.
Jawaban:
Tes Hosmer-Lemeshow sampai batas tertentu sudah usang karena memerlukan peniadaan probabilitas yang diprediksi secara sewenang-wenang dan tidak memiliki kekuatan yang sangat baik untuk mendeteksi kurangnya kalibrasi. Itu juga tidak sepenuhnya menghukum karena overfitting ekstrim dari model. Metode yang lebih baik tersedia seperti Hosmer, DW; Hosmer, T .; le Cessie, S. & Lemeshow, S. Perbandingan tes good-of-fit untuk model regresi logistik. Statistik dalam Kedokteran , 1997, 16 , 965-980. Ukuran baru mereka diimplementasikan dalam RR2 c
rms
sumber
rms