Nilai yang hilang dalam variabel respons dalam JAGS

10

Gelman & Hill (2006) mengatakan:

Dalam Bug, hasil yang hilang dalam regresi dapat ditangani dengan mudah hanya dengan memasukkan vektor data, NA, dan semuanya. Bug secara eksplisit memodelkan variabel hasil, dan oleh karena itu sepele untuk menggunakan model ini untuk, dalam pengaruh, menghitung nilai yang hilang pada setiap iterasi.

Ini kedengarannya seperti cara mudah menggunakan JAGS untuk melakukan prediksi. Tetapi apakah pengamatan dengan hasil yang hilang juga memengaruhi estimasi parameter? Jika demikian, adakah cara mudah untuk menyimpan pengamatan ini dalam dataset yang dilihat JAGS, tetapi untuk tidak memengaruhi perkiraan parameter? Saya sedang berpikir tentang fungsi cut, tapi itu hanya tersedia dalam BUGS, bukan JAGS.

Jack Tanner
sumber

Jawaban:

11

Ya, sangat mudah digunakan dalam BUGS atau JAGS! Ini sebenarnya menyenangkan untuk menggunakannya!

Tetapi apakah pengamatan dengan hasil yang hilang juga memengaruhi estimasi parameter?

Tentu saja tidak. Parameter hanya dipengaruhi oleh hasil yang diamati. Hasil yang hilang (NAs) tidak akan mempengaruhi apa pun, sebenarnya itu adalah cara lain: hasil yang hilang akan berasal dari parameter. Perhatikan bahwa hasil yang hilang akan memiliki distribusi posteriornya juga. Maka sangat mudah untuk menghitung beberapa jumlah yang diturunkan misalnya seperti jumlah atas indeks hasil, dan jumlah yang diturunkan ini tidak hanya ditangani untuk nilai yang hilang, tetapi juga segera memiliki distribusi posterior mereka. Itulah yang sangat seksi di BUGS & JAGS!

Selamat bersenang-senang!

Ingin tahu
sumber
1
Maaf, saya tidak yakin bahwa hasil yang hilang tidak memengaruhi estimasi parameter. Jackman tampaknya mengatakan yang sebaliknya: jackman.stanford.edu/blog/?p=38
Jack Tanner
@ JackTanner, pikirkan sebentar. Bagaimana nilai yang hilang dapat memengaruhi sesuatu? Ketika algoritma dimulai, nilai yang hilang akan mulai diperhitungkan dari estimasi parameter (ini berasal dari hasil yang diamati). Kemudian (mungkin, saya tidak yakin), informasi dari hasil yang hilang yang diperhitungkan dapat memantul kembali ke parameter, tetapi tidak masalah - itu hanya informasi asli, yang ada dalam parameter, dipantulkan kembali ke mereka. Informasi NYATA yang memengaruhi sesuatu hanya datang dari hasil NYATA. Jika Anda tidak mempercayai saya, buat simulasi, bandingkan hasilnya dan posting di sini.
Penasaran
Mengenai tautan Anda, ia tampaknya tidak yakin tentang hal itu, ia mengatakan "masalah" - dalam tanda kutip, dan ia mengatakan "akan menarik untuk membandingkannya". Saya katakan tidak akan ada perbedaan yang signifikan. Jika Anda ingin mengujinya, silakan.
Penasaran
3
Saya setuju; tidak ada perbedaan yang signifikan. Saya menggunakan pendekatan ini untuk membangun distribusi prediksi posterior; cukup letakkan nilai-nilai prediktif dari variabel sisi kanan bersama dengan nilai-nilai masa lalu, dan NAs untuk variabel target "pengamatan" yang sesuai dengan nilai-nilai prediktif.
jbowman
@jbowman, ya, catatan bagus! Bukan ide yang jelas untuk melakukan prediksi seperti ini!
Penasaran