Mengapa menambahkan efek lag meningkatkan penyimpangan rata-rata dalam model hirarki Bayesian?

14

Latar belakang: Saat ini saya sedang melakukan beberapa pekerjaan membandingkan berbagai model hirarki Bayesian. Data adalah ukuran numerik dari kesejahteraan untuk peserta dan waktu . Saya memiliki sekitar 1.000 peserta dan 5 hingga 10 pengamatan per peserta.ysayajsayaj

Seperti kebanyakan dataset longitudinal, saya berharap untuk melihat beberapa bentuk auto-korelasi dimana pengamatan yang lebih dekat pada waktunya memiliki korelasi yang lebih besar daripada yang terpisah jauh. Menyederhanakan beberapa hal, model dasarnya adalah sebagai berikut:

ysayajN(μsayaj,σ2)

tempat saya membandingkan model tanpa lag:

μsayaj=β0saya

dengan model lag:

μsayaj=β0saya+β1(ysaya(j-1)-β0saya)

di mana adalah rata-rata level orang dan adalah parameter lag (yaitu, efek lag menambahkan kelipatan dari penyimpangan pengamatan dari titik waktu sebelumnya dari nilai prediksi titik waktu itu). Saya juga harus melakukan beberapa hal untuk memperkirakan (yaitu, observasi sebelum pengamatan pertama).β0sayaβ1ysaya0

Hasil yang saya dapatkan menunjukkan bahwa:

  • Parameter lag adalah sekitar 0,18, 95% CI [.14, .21]. Yaitu, ini bukan nol
  • Penyimpangan rata-rata dan DIC keduanya meningkat beberapa ratus ketika lag dimasukkan dalam model
  • Pemeriksaan prediktif posterior menunjukkan bahwa dengan memasukkan efek lag, model lebih mampu memulihkan korelasi-otomatis dalam data

Jadi secara ringkas, parameter lag non-nol dan pemeriksaan prediktif posterior menunjukkan model lag lebih baik; namun penyimpangan rata-rata dan DIC menunjukkan bahwa model tanpa lag lebih baik. Ini membingungkan saya.

Pengalaman umum saya adalah bahwa jika Anda menambahkan parameter yang berguna itu setidaknya harus mengurangi penyimpangan rata-rata (bahkan jika setelah penalti kompleksitas DIC tidak ditingkatkan). Selain itu, nilai nol untuk parameter lag akan mencapai penyimpangan yang sama dengan model no lag.

Pertanyaan

Mengapa menambahkan efek lag meningkatkan penyimpangan rata-rata dalam model hierarkis Bayesian bahkan ketika parameter lag tidak nol dan meningkatkan pemeriksaan prediktif posterior?

Pikiran awal

  • Saya telah melakukan banyak pemeriksaan konvergensi (misalnya, melihat traceplots; memeriksa variasi dalam hasil penyimpangan lintas rantai dan lintas berjalan) dan kedua model tampaknya telah berkumpul di posterior.
  • Saya telah melakukan pemeriksaan kode di mana saya memaksa efek lag menjadi nol, dan ini memulihkan penyimpangan model no lag.
  • Saya juga melihat penyimpangan rata-rata dikurangi hukuman yang seharusnya menghasilkan penyimpangan pada nilai yang diharapkan, dan ini juga membuat model lag tampak lebih buruk.
  • Mungkin efek lag mengurangi jumlah pengamatan efektif per orang yang mengurangi kepastian dalam memperkirakan rata-rata level orang ( ) yang meningkatkan penyimpangan.β0saya
  • Mungkin ada beberapa masalah dengan bagaimana saya memperkirakan titik waktu tersirat sebelum pengamatan pertama.
  • Mungkin efek lag hanya lemah dalam data ini
  • Saya mencoba memperkirakan model menggunakan kemungkinan menggunakan maksimum lmedengan correlation=corAR1(). Perkiraan parameter lag sangat mirip. Dalam hal ini model lag memiliki kemungkinan log yang lebih besar dan AIC yang lebih kecil (sekitar 100) daripada yang tanpa lag (yaitu, itu menyarankan model lag lebih baik). Jadi ini memperkuat gagasan bahwa menambahkan jeda juga harus menurunkan penyimpangan dalam model Bayesian.
  • Mungkin ada sesuatu yang istimewa tentang residu Bayesia. Jika model lag menggunakan perbedaan antara y diprediksi dan aktual pada titik waktu sebelumnya, maka kuantitas ini akan menjadi tidak pasti. Dengan demikian, efek lag akan beroperasi selama interval kredibel dari nilai residu tersebut.
Jeromy Anglim
sumber
Anda mengatakan bahwa parameter lag sekitar 0,18. Apakah Anda mempelajari parameter-lag? Jika ya, apa yang sebelumnya Anda gunakan?
KTT
N(β0saya,σ2)

Jawaban:

1

Inilah pikiran saya:

  • Alih-alih DIC, BIC, AIC saya sarankan untuk langsung bekerja dengan kemungkinan marginal (juga dikenal sebagai bukti ) jika Anda mampu membelinya. Semakin besar bukti , semakin besar kemungkinan kelas model Anda. Ini mungkin tidak membuat perbedaan besar, tetapi DIC, BIC, AIC, setelah semua, hanyalah perkiraan.
  • 0,18
  • Mari kita melangkah lebih jauh: Ambil model yang tidak mempertimbangkan efek jeda (c) dan hitung kemungkinan marginalnya . Selanjutnya, ambil kelas model Anda (d) yang menggabungkan efek lag dan memiliki prior pada parameter lag; hitung kemungkinan marginal dari (d). Anda akan berharap bahwa (d) memiliki kemungkinan marjinal yang lebih besar . Jadi apa, jika tidak ?:

    (1) Kemungkinan marginal mempertimbangkan kelas model secara keseluruhan. Ini termasuk efek lag, jumlah parameter, kemungkinan, yang sebelumnya.

    (2) Membandingkan model yang memiliki jumlah parameter berbeda selalu rumit, jika ada ketidakpastian yang cukup besar sebelum parameter tambahan.

    (3) Jika Anda menentukan ketidakpastian sebelum parameter-lag Anda terlalu besar, Anda menghukum seluruh kelas model.

    (4) Apa informasi yang mendukung probabilitas yang sama untuk lag negatif dan untuk lag positif? Saya percaya bahwa sangat tidak mungkin untuk mengamati kelambatan negatif, dan ini harus dimasukkan dalam sebelumnya.

    (5) Sebelumnya yang Anda pilih pada parameter-lag Anda seragam. Ini biasanya tidak pernah merupakan pilihan yang baik: Apakah Anda benar-benar yakin bahwa parameter Anda harus benar-benar berada di dalam batas yang ditentukan? Apakah setiap lag-value di dalam batas benar-benar memiliki kemungkinan yang sama? Saran saya: gunakan distribusi beta (jika Anda yakin bahwa lag dibatasi; atau dengan log-normal jika Anda dapat mengecualikan nilai yang lebih kecil dari nol .

    (6) Ini adalah contoh khusus, di mana penggunaan prior non-informatif tidak baik (melihat kemungkinan marginal ): Anda akan selalu menyukai model yang memiliki lebih sedikit parameter tidak pasti; tidak masalah seberapa baik atau buruk model dengan lebih banyak parameter dapat dilakukan.

Saya harap pikiran saya memberi Anda beberapa ide baru, petunjuk ?!

Puncak
sumber
Terima kasih atas tipsnya. Hanya untuk menyelesaikannya, saya mencoba membatasi parameter lag untuk memiliki nilai rata-rata posterior (yaitu, 0,18). Model no lag masih memiliki penyimpangan rata-rata yang lebih kecil.
Jeromy Anglim