Kami telah dilengkapi fungsi nonlinier untuk data yang diamati. Langkah selanjutnya adalah penilaian kebaikan kesesuaian fungsi ini (seperti untuk model linier).
Apa cara yang biasa untuk mengukur ini?
Edit 1:
Pemasangan dilakukan sebagai berikut:
- Lakukan regresi linier dengan variabel bebas A dan B .
- Hitung parameter distribusi dari parameter regresi. (Distribusi nonlinier dan memiliki variabel C sebagai input.)
- Menilai goodness of fit distribusi nonlinear dengan membandingkan estimasi data yang diamati.
Edit 2:
Contoh untuk langkah-langkah yang disebutkan di atas:
- Model regresi:
- dan untuk distribusi nonlinier berikut:
- Nilai kebaikan fit of dengan serangkaian pengamatan .
goodness-of-fit
nonlinear
Marco
sumber
sumber
Jawaban:
Mungkin ada lebih banyak untuk itu, tetapi bagi saya tampaknya Anda hanya ingin menentukan goodness of fit (GoF) untuk fungsi f (a), dipasang ke set data tertentu (a, f (a)). Jadi, berikut ini hanya menjawab sub-pertanyaan ketiga Anda (saya tidak berpikir yang pertama dan kedua secara langsung relevan dengan yang ketiga).
Biasanya, GoF dapat ditentukan secara parametrik (jika Anda tahu parameter fungsi distribusi) atau non-parametrik (jika Anda tidak mengetahuinya). Meskipun Anda mungkin dapat mengetahui parameter untuk fungsi tersebut, karena tampaknya itu eksponensial atau gamma / Weibull (dengan asumsi data kontinu). Meskipun demikian, saya akan melanjutkan, seolah-olah Anda tidak tahu parameternya. Dalam hal ini, ini adalah proses dua langkah . Pertama, Anda perlu menentukan parameter distribusi untuk set data Anda. Kedua, Anda melakukan tes GoF untuk distribusi yang ditentukan. Untuk menghindari pengulangan, pada titik ini saya akan mengarahkan Anda ke jawaban saya sebelumnyauntuk pertanyaan terkait, yang berisi beberapa detail bermanfaat. Jelas, jawaban ini dapat dengan mudah diterapkan pada distribusi, selain dari yang disebutkan di dalam.
Selain tes GoF, disebutkan di sana, Anda dapat mempertimbangkan tes lain - tes GoF chi-square . Tidak seperti KS dan AD tes, yang berlaku hanya untuk distribusi kontinu, uji GOF chi-square berlaku untuk kedua diskrit dan kontinyu yang. Uji Chi-square GoF dapat dilakukan dalam R dengan menggunakan salah satu dari beberapa paket:
stats
paket bawaan (fungsichisq.test()
) danvcd
paket (fungsigoodfit()
- hanya untuk data diskrit). Rincian lebih lanjut tersedia dalam dokumen ini .sumber
Nah, di Machine Learning hal yang disebut Cross Validation dilakukan cukup sering untuk tujuan pengujian model (uji apakah tipe model dengan parameter-hiper ini - seperti jumlah derajat kebebasan atau apa pun - sesuai dengan masalah Anda) - Anda membagi data beberapa kali ke dalam rangkaian data kereta dan uji, kemudian jalankan optimisasi di atas rangkaian pelatihan dan hitung kualitas apa pun di atas data tes. Cara paling rahasia adalah menjalankan apa yang disebut "validasi lintas QxT-lipat". Pseudocode bisa seperti:
sumber