Apa yang dimaksud dengan interval kepercayaan di sekitar nilai prediksi dari model efek campuran?

14

Saya melihat halaman inidan perhatikan metode untuk interval kepercayaan untuk lme dan lmer di R. Bagi mereka yang tidak tahu R, itu adalah fungsi untuk menghasilkan efek campuran atau model multi-level. Jika saya memiliki efek tetap pada sesuatu seperti desain tindakan berulang apa yang akan berarti interval kepercayaan di sekitar nilai prediksi (mirip dengan rata-rata) artinya? Saya dapat memahami bahwa untuk suatu efek Anda dapat memiliki interval kepercayaan yang masuk akal tetapi bagi saya interval kepercayaan di sekitar rata-rata yang diperkirakan dalam desain seperti itu tampaknya tidak mungkin. Bisa jadi sangat besar untuk mengakui fakta bahwa variabel acak berkontribusi terhadap ketidakpastian dalam estimasi, tetapi dalam kasus itu tidak akan berguna sama sekali dalam arti inferensial membandingkan seluruh nilai. Atau,

Apakah saya kehilangan sesuatu di sini atau apakah analisis saya tentang situasi itu benar? ... [dan mungkin merupakan alasan mengapa hal itu tidak diterapkan dalam Lmer (tetapi mudah didapat di SAS). :)]

John
sumber
Karena pada dasarnya, bersarang di dalam lmer menjadikannya desain tindakan berulang-ulang, adakah cara di mana pertanyaan Anda tentang interval kepercayaan yang tepat di sekitar ukuran efek terkait dengan pertanyaan di ANOVA tindakan berulang-ulang tentang ukuran ukuran efek yang dilaporkan? Secara khusus, tidak jelas apakah istilah kesalahan harus menyertakan varians subjek atau tidak (dll)?
russellpierce
Nevermind - Saya tidak berpikir sejauh itu.
russellpierce

Jawaban:

7

Ini memiliki arti yang sama dengan interval kepercayaan lainnya: dengan asumsi bahwa model itu benar, jika percobaan dan prosedur diulangi berulang kali, 95% dari waktu nilai sebenarnya dari jumlah bunga akan berada dalam interval. Dalam hal ini, kuantitas bunga adalah nilai yang diharapkan dari variabel respons.

Mungkin paling mudah untuk menjelaskan ini dalam konteks model linier (model campuran hanyalah perpanjangan dari ini, jadi ide yang sama berlaku):

Asumsi yang biasa adalah:

ysaya=Xsaya1β1+Xsaya2β2+...Xsayahalβhal+ϵ

ysayaXsayajβjϵ

E[ysaya]=Xsaya1β1+Xsaya2β2+...Xsayahalβhal

yang merupakan fungsi linier dari parameter (tidak diketahui), karena kovariat diketahui (dan diperbaiki). Karena kita mengetahui distribusi sampling dari vektor parameter, kita dapat dengan mudah menghitung distribusi sampling (dan karenanya interval kepercayaan) dari jumlah ini.

Jadi mengapa Anda ingin mengetahuinya? Saya kira jika Anda melakukan prediksi out-of-sample, ini dapat memberi tahu Anda seberapa baik perkiraan Anda (meskipun Anda harus mempertimbangkan ketidakpastian model akun).

Simon Byrne
sumber
Itu skenario kedua saya, interval kepercayaan terlalu besar untuk memiliki nilai inferensial dalam desain percobaan karena perbedaan antara kondisi didasarkan pada efek dengan antara variabilitas S dihapus. Tampaknya itu selalu memiliki makna kompromi dan membutuhkan nama khusus itu sendiri karena Anda tidak dapat menggunakannya seperti CI biasa.
John
Blouin & Riopelle (2005) menyebut mereka interval kepercayaan inferensi sempit dan luas tetapi mengingat bahwa populasi ilmiah umum di luar statistik memiliki waktu yang cukup sulit dengan yang biasa ...
John
1

Mungkin ini masuk akal dalam kerangka Bayesian. Pertimbangkan misalnya model anova efek acak satu arah:

(ysayaj|μsaya)N(μsaya,σw2),μsayaN(μ,σb2),
dan distribusi sebelumnya pada rata-rata keseluruhan μ dan komponen varians σw2 dan σb2. Lalu masing-masingμsaya memiliki distribusi posterior, dan a 95% Interval dispersi dari distribusi ini dapat memainkan peran a 95% Interval "kepercayaan".
Stéphane Laurent
sumber