Saya memiliki model nonlinear , di mana Φ adalah cdf dari distribusi normal standar dan f adalah nonlinear (lihat di bawah). Saya ingin menguji kebaikan kesesuaian model ini dengan parameter a pada data saya ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x n , y n ), setelah menggunakan estimasi kemungkinan maksimum untuk menemukan . Apa yang akan menjadi tes yang sesuai? Saya ingin menggunakan tes ini untuk menyebut kecocokan buruk sebagai buruk dan menentukan apakah lebih banyak data harus dikumpulkan.
Saya telah melihat ke dalam menggunakan penyimpangan, yang membandingkan model ini dengan model jenuh, dengan uji yang sesuai dari goodness of fit menggunakan distribusi . Apakah ini pantas? Sebagian besar apa yang saya baca tentang penyimpangan berlaku untuk GLM, yang bukan apa yang saya miliki. Jika uji penyimpangan tersebut sesuai, asumsi apa yang perlu dipegang untuk membuat tes tersebut valid?
Pembaruan: untukx>1,sebuah>0dalam hal ini membantu.
sumber
Jawaban:
Gunakan paket "npcmstest" di pustaka "NP" jika Anda menggunakan platform R. Peringatan: Fungsi ini mungkin memerlukan beberapa menit untuk mengevaluasi model Anda.
Anda juga dapat mempertimbangkan perbandingan informasi-teoretis dari distribusi respons dan distribusi prediktif (yaitu KL divergensi, lintas-entropi, dll.)
sumber
lm
glm
gam
atau sejenisnya (mgcv
paket)? Jika tidak, Anda harus memeriksanya.Inilah cara saya akan melakukannya, pada dasarnya tes rasio kemungkinan. Tapi ingat mereka "kunci" untuk memahami uji goodness of fit, adalah memahami kelas alternatif yang Anda uji menentang. Sekarang kami memiliki kemungkinan untuk setiap titik data individu sebagai:
sumber
Dalam konteks regresi linier, pengujian goodness of fit sering dilakukan terhadap alternatif yang lebih rumit. Anda memiliki regresi linier - masukkan beberapa istilah polinomial untuk menguji apakah bentuk linearnya cukup. Karena Anda sudah memiliki bentuk fungsional nonlinier, alternatif rumit yang perlu Anda pertimbangkan adalah regresi non-parametrik . Saya tidak akan mencoba memberikan pengantar untuk topik tersebut, karena ia membutuhkan pola pikirnya sendiri, dan perlu ada pengantar terpisah yang layak. Untuk uji regresi parametrik vs nonparametrik, Wooldridge (1992) atau Hardle dan Mammen (1993) , mereka melakukan hal yang sangat mirip. Hardle juga menulis buku yang bagus tentang topik itu.
sumber