Bagaimana kita membandingkan kompleksitas dua model dengan jumlah parameter yang sama?
Sunting 09/19 : Untuk memperjelas, kompleksitas model adalah ukuran seberapa sulitnya untuk belajar dari data yang terbatas. Ketika dua model cocok dengan data yang ada sama baiknya, model dengan kompleksitas yang lebih rendah akan memberikan kesalahan yang lebih rendah pada data masa depan. Ketika perkiraan digunakan, ini secara teknis mungkin tidak selalu benar, tetapi tidak apa-apa jika cenderung benar dalam praktiknya. Berbagai perkiraan memberikan ukuran kompleksitas yang berbeda
model-selection
Yaroslav Bulatov
sumber
sumber
Jawaban:
Selain berbagai ukuran Panjang Deskripsi Minimum (misalnya, kemungkinan maksimum yang dinormalisasi, perkiraan Informasi Fisher), ada dua metode lain yang layak disebutkan:
Bootstrap parametrik . Jauh lebih mudah diimplementasikan daripada tindakan MDL yang menuntut. Makalah yang bagus ditulis oleh Wagenmaker dan koleganya:
Wagenmakers, E.-J., Ratcliff, R., Gomez, P., & Iverson, GJ (2004). Menilai model mimikri menggunakan bootstrap parametrik . Jurnal Psikologi Matematika , 48, 28-50.
Abstrak:
Pembaruan: Menilai model mimikri dalam bahasa Inggris sederhana. Anda mengambil salah satu dari dua model yang bersaing dan secara acak memilih satu set parameter untuk model itu (baik data diinformasikan atau tidak). Kemudian, Anda menghasilkan data dari model ini dengan set parameter yang dipilih. Selanjutnya, Anda membiarkan kedua model sesuai dengan data yang dihasilkan dan memeriksa yang mana dari dua model kandidat yang memberikan kecocokan yang lebih baik. Jika kedua model sama-sama fleksibel atau rumit, model dari mana Anda menghasilkan data harus memberikan kecocokan yang lebih baik. Namun, jika model lain lebih kompleks, itu bisa memberikan kecocokan yang lebih baik, meskipun data dihasilkan dari model lain. Anda ulangi ini beberapa kali dengan kedua model (yaitu, biarkan kedua model menghasilkan data dan lihat mana di antara keduanya yang lebih cocok). Model yang "overfits" data yang dihasilkan oleh model lain adalah yang lebih kompleks.
Validasi Lintas : Ini juga cukup mudah diimplementasikan. Lihat jawaban untuk pertanyaan ini . Namun, perhatikan bahwa masalah dengan itu adalah bahwa pilihan di antara aturan pemotongan sampel (biarkan-keluar-satu, K-lipat, dll) adalah yang tidak berprinsip.
sumber
Saya pikir itu akan tergantung pada prosedur pemasangan model yang sebenarnya. Untuk ukuran yang berlaku secara umum, Anda dapat mempertimbangkan Generalized Degrees of Freedom yang dijelaskan dalam Ye 1998 - pada dasarnya sensitivitas perubahan estimasi model terhadap gangguan pengamatan - yang berfungsi dengan baik sebagai ukuran kompleksitas model.
sumber
Minimum Deskripsi Panjang (MDL) dan Panjang Pesan Minimum (MML) tentu saja layak untuk dicoba.
Sejauh MDL yang bersangkutan, makalah sederhana yang menggambarkan prosedur Normalized Maximum Likelihood (NML) serta perkiraan asimptotik adalah:
Di sini, mereka melihat kompleksitas model distribusi Geometrik vs. Poisson. Tutorial MDL yang luar biasa (gratis) dapat ditemukan di sini .
Atau, makalah tentang kompleksitas distribusi eksponensial yang diperiksa dengan MML dan MDL dapat ditemukan di sini . Sayangnya, tidak ada tutorial terbaru tentang MML, tetapi buku ini adalah referensi yang sangat baik, dan sangat dianjurkan.
sumber
Minimum Deskripsi Panjang mungkin merupakan jalan yang layak dikejar.
sumber
Yang dimaksud dengan "kompleksitas model" biasanya berarti kekayaan ruang model. Perhatikan bahwa definisi ini tidak tergantung pada data. Untuk model linier, kekayaan ruang model diukur secara sepele dengan berkurangnya ruang. Inilah yang oleh beberapa penulis disebut "derajat kebebasan" (walaupun secara historis, derajat kebebasan disediakan untuk perbedaan antara ruang model dan ruang sampel). Untuk model non linier, mengukur kekayaan ruang kurang sepele. Derajat Kebebasan Umum (lihat jawaban ars) adalah ukuran yang demikian. Ini memang sangat umum dan dapat digunakan untuk ruang model "aneh" seperti pohon, KNN, dan sejenisnya. The Dimensi VC adalah ukuran lain.
Seperti disebutkan di atas, definisi "kompleksitas" ini adalah data yang independen. Jadi dua model dengan jumlah parameter yang sama biasanya akan memiliki "kompleksitas" yang sama.
sumber
Dari komentar Yaroslav hingga jawaban Henrik:
tetapi validasi silang tampaknya hanya menunda tugas menilai kompleksitas. Jika Anda menggunakan data untuk memilih parameter Anda dan model Anda seperti dalam cross-validation, pertanyaan yang relevan menjadi bagaimana memperkirakan jumlah data yang diperlukan untuk "meta" ini - pengolah untuk bekerja dengan baik
Anda bahkan dapat memberikan rasa 'signifikansi' untuk ini karena hasil prosedur secara langsung dalam hal (unit) perbedaan keluar dari kesalahan peramalan sampel.
sumber
Bagaimana dengan kriteria informasi untuk perbandingan model? Lihat misalnya http://en.wikipedia.org/wiki/Akaike_information_criterion
Kompleksitas model di sini adalah jumlah parameter dari model.
sumber