Bagaimana cara menilai goodness of fit model nonlinear tertentu? [Tutup]

10

Saya memiliki model nonlinear , di mana Φ adalah cdf dari distribusi normal standar dan f adalah nonlinear (lihat di bawah). Saya ingin menguji kebaikan kesesuaian model ini dengan parameter a pada data saya ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n )y=Φ(f(x,a))+εΦa(x1,y1),(x2,y2),,(xn,yn), setelah menggunakan estimasi kemungkinan maksimum untuk menemukan . Apa yang akan menjadi tes yang sesuai? Saya ingin menggunakan tes ini untuk menyebut kecocokan buruk sebagai buruk dan menentukan apakah lebih banyak data harus dikumpulkan.a

Saya telah melihat ke dalam menggunakan penyimpangan, yang membandingkan model ini dengan model jenuh, dengan uji yang sesuai dari goodness of fit menggunakan distribusi . Apakah ini pantas? Sebagian besar apa yang saya baca tentang penyimpangan berlaku untuk GLM, yang bukan apa yang saya miliki. Jika uji penyimpangan tersebut sesuai, asumsi apa yang perlu dipegang untuk membuat tes tersebut valid?χn12

Pembaruan: untukx>1,sebuah>0dalam hal ini membantu.f=x1ax2+1x>1,a>0

spadequack
sumber
1
y=Φ(f(x,a)+ε)y=Φ(f(x,a))+εε
Terima kasih. Saya sudah mengklarifikasi pertanyaan saya. Saya sadar bahwa tidak ada jawaban terbaik, namun, saya masih ingin tahu apakah penyimpangan cocok untuk menguji kebaikan di sini, dan jika tidak, apa tes lain yang cocok untuk menandai kecocokan sebagai sangat buruk dan mengatakan lebih banyak data perlu dikumpulkan (dengan asumsi modelnya benar) atau mengatakan model itu tidak menggambarkan data.
spadequack
1
y0,1p(y=1)=Φ(f(x,a))y=0y=1p(y=1)=y¯, atau penyimpangan, atau beberapa alternatif lain. Jika yang terakhir, apa distribusi yang Anda asumsikan untuk residu?
jbowman
1
Voting untuk ditutup karena permintaan untuk klarifikasi tidak dijawab.
whuber

Jawaban:

1

Gunakan paket "npcmstest" di pustaka "NP" jika Anda menggunakan platform R. Peringatan: Fungsi ini mungkin memerlukan beberapa menit untuk mengevaluasi model Anda.

Anda juga dapat mempertimbangkan perbandingan informasi-teoretis dari distribusi respons dan distribusi prediktif (yaitu KL divergensi, lintas-entropi, dll.)

Ram Ahluwalia
sumber
lmglmf
@Apakah Anda menggunakan gamatau sejenisnya ( mgcvpaket)? Jika tidak, Anda harus memeriksanya.
suncoolsu
1

Inilah cara saya akan melakukannya, pada dasarnya tes rasio kemungkinan. Tapi ingat mereka "kunci" untuk memahami uji goodness of fit, adalah memahami kelas alternatif yang Anda uji menentang. Sekarang kami memiliki kemungkinan untuk setiap titik data individu sebagai:

p(yi|xi,a,I)=g(ϵi)=g(yifi)

g(ϵ)fi=xi1axi2+1xia(xi,yi)afi=yiχ2g(ϵ)xj,yjyia

probabilityislogic
sumber
1
O(n)
0

Dalam konteks regresi linier, pengujian goodness of fit sering dilakukan terhadap alternatif yang lebih rumit. Anda memiliki regresi linier - masukkan beberapa istilah polinomial untuk menguji apakah bentuk linearnya cukup. Karena Anda sudah memiliki bentuk fungsional nonlinier, alternatif rumit yang perlu Anda pertimbangkan adalah regresi non-parametrik . Saya tidak akan mencoba memberikan pengantar untuk topik tersebut, karena ia membutuhkan pola pikirnya sendiri, dan perlu ada pengantar terpisah yang layak. Untuk uji regresi parametrik vs nonparametrik, Wooldridge (1992) atau Hardle dan Mammen (1993) , mereka melakukan hal yang sangat mirip. Hardle juga menulis buku yang bagus tentang topik itu.

Tugas
sumber