mendapatkan derajat kebebasan dari Lmer

11

Saya sudah cocok dengan model lmer dengan yang berikut ini (walaupun dibuat keluaran):

Random effects:
 Groups        Name        Std.Dev.
 day:sample (Intercept)    0.09
 sample        (Intercept) 0.42
 Residual                  0.023 

Saya benar-benar ingin membangun interval kepercayaan untuk setiap efek menggunakan rumus berikut:

(n-1)s2χα/2,n-12,(n-1)s2χ1-α/2,n-12

Apakah ada cara untuk dengan mudah keluar dari derajat kebebasan?

pengguna1357015
sumber
1
Saya pikir Anda ingin memeriksa lmerTest . Ada sejumlah perkiraan untuk memperkirakan df dalam model efek-campuran untuk efek-efek tetap (mis. Satterthwaite , Kenward-Roger, dll.) Untuk kasus Anda, saya merasa Anda terlalu rumit dalam hidup Anda. Anda menganggap setiap efek sebagai Gaussian. Cukup gunakan deviasi standar untuk mendapatkan interval kepercayaan pilihan Anda.
usεr11852
3
@ usεr11852 Dalam model efek-campuran Anda menganggap bahwa setiap efek adalah Gaussian, tetapi parameternya adalah varian dari distribusi Gaussian, bukan mean. Jadi distribusi estimatornya akan sangat miring, dan interval kepercayaan normal ± ~ 2 standar deviasi tidak akan sesuai.
Karl Ove Hufthammer
1
@KarlOveHufthammer: Anda berhak menunjukkan ini; Saya mengerti maksud Anda (dan mungkin OP). Saya pikir dia prihatin tentang cara dan / atau realisasi efek acak ketika dia menyebutkan derajat kebebasan.
usεr11852
derajat kebebasan adalah "bermasalah" untuk model campuran, lihat: stat.ethz.ch/pipermail/r-help/2006-May/094765.html dan stats.stackexchange.com/questions/84268/…
Tim

Jawaban:

17

Sebagai gantinya saya hanya akan membuat interval kepercayaan kemungkinan profil . Mereka dapat diandalkan, dan sangat mudah untuk dihitung menggunakan paket 'lme4'. Contoh:

> library(lme4)
> fm = lmer(Reaction ~ Days + (Days | Subject),
            data=sleepstudy)
> summary(fm)
[]
Random effects:
 Groups   Name        Variance Std.Dev. Corr
 Subject  (Intercept) 612.09   24.740       
          Days         35.07    5.922   0.07
 Residual             654.94   25.592       

Anda sekarang dapat menghitung interval kepercayaan kemungkinan profil dengan confint()fungsi:

> confint(fm, oldNames=FALSE)
Computing profile confidence intervals ...
                               2.5 %  97.5 %
sd_(Intercept)|Subject        14.381  37.716
cor_Days.(Intercept)|Subject  -0.482   0.685
sd_Days|Subject                3.801   8.753
sigma                         22.898  28.858
(Intercept)                  237.681 265.130
Days                           7.359  13.576

Anda juga dapat menggunakan bootstrap parametrik untuk menghitung interval kepercayaan. Berikut sintaks R (menggunakan parmargumen untuk membatasi parameter yang kami inginkan interval kepercayaan untuk):

> confint(fm, method="boot", nsim=1000, parm=1:3)
Computing bootstrap confidence intervals ...
                              2.5 % 97.5 %
sd_(Intercept)|Subject       11.886 35.390
cor_Days.(Intercept)|Subject -0.504  0.929
sd_Days|Subject               3.347  8.283

Hasilnya akan sedikit bervariasi untuk setiap proses. Anda dapat meningkatkan nsimuntuk mengurangi variasi ini, tetapi ini juga akan menambah waktu yang dibutuhkan untuk memperkirakan interval kepercayaan.

Karl Ove Hufthammer
sumber
1
Jawaban bagus (+1). Saya juga akan menyebutkan fakta bahwa seseorang juga bisa mendapatkan CI dari bootstrap parametrik dalam kasus ini. Utas ini berisi diskusi yang sangat menarik tentang masalah ini.
usεr11852
@ usεr11852 Terima kasih atas sarannya. Saya sekarang telah menambahkan contoh menggunakan bootstrap parametrik.
Karl Ove Hufthammer
6

Derajat kebebasan untuk model campuran adalah "bermasalah". Untuk membaca lebih lanjut tentang itu Anda dapat memeriksa lmer, nilai-p dan semua posting oleh Douglas Bates. Juga r-sig-mixed-model FAQ merangkum alasan mengapa hal itu menyusahkan:

  • Secara umum tidak jelas bahwa distribusi nol dari rasio perhitungan jumlah kuadrat sebenarnya adalah distribusi F, untuk setiap pilihan derajat kebebasan penyebut. Walaupun ini berlaku untuk kasus khusus yang sesuai dengan desain eksperimental klasik (bersarang, plot terpisah, blok acak, dll.), Tampaknya tidak benar untuk desain yang lebih kompleks (tidak seimbang, GLMM, korelasi temporal atau spasial, dll.).
  • Untuk setiap resep derajat kebebasan sederhana yang telah disarankan (jejak matriks topi, dll.) Tampaknya ada setidaknya satu contoh tandingan yang cukup sederhana di mana resep tersebut gagal parah.
  • Skema aproksimasi df lainnya yang telah disarankan (Satterthwaite, Kenward-Roger, dll.) Tampaknya akan cukup sulit untuk diterapkan di lme4 / nlme,
    (...)
  • Karena penulis utama lme4 tidak yakin tentang kegunaan dari pendekatan umum pengujian dengan mengacu pada distribusi nol perkiraan, dan karena overhead dari orang lain yang menggali kode untuk mengaktifkan fungsi yang relevan (sebagai tambalan atau tambahan -on), situasi ini tidak mungkin berubah di masa depan.

FAQ juga memberikan beberapa alternatif

  • gunakan MASS :: glmmPQL (menggunakan aturan nlme lama yang kira-kira setara dengan aturan SAS 'luar-dalam') untuk GLMMs, atau (n) lme untuk LMMs
  • Tebak penyebut df dari aturan standar (untuk desain standar) dan terapkan pada uji t atau F.
  • Jalankan model dalam lme (jika mungkin) dan gunakan penyebut df yang dilaporkan di sana (yang mengikuti aturan 'luar-dalam' sederhana yang harus sesuai dengan jawaban kanonik untuk desain sederhana / desain ortogonal), diterapkan pada uji t atau F. Untuk spesifikasi eksplisit aturan yang saya gunakan, lihat halaman 91 dari Pinheiro dan Bates - halaman ini tersedia di Google Buku
  • gunakan SAS, Genstat (AS-REML), Stata?
  • Asumsikan penyebut tanpa batas df (yaitu uji Z / chi-kuadrat daripada t / F) jika jumlah kelompok besar (> 45? Berbagai aturan praktis untuk seberapa besar "hampir tak terbatas" telah diajukan, termasuk [dalam Angrist dan Pischke's '' Mostly Harmless Econometrics ''], 42 (dalam penghormatan kepada Douglas Adams)

Tetapi jika Anda tertarik pada interval kepercayaan ada pendekatan yang lebih baik, misalnya berdasarkan bootstrap seperti yang disarankan oleh Karl Ove Hufthammer dalam jawabannya, atau yang diusulkan dalam FAQ.

Tim
sumber
"Tebak penyebut df dari aturan standar (untuk desain standar) dan terapkan pada uji t atau F"; Saya benar-benar ingin jika seseorang bisa menjelaskannya. Misalnya, untuk desain bersarang (mis. Pasien vs kontrol, beberapa sampel per subjek; dengan ID subjek menjadi efek acak), bagaimana kita mendapatkan derajat kebebasan untuk desain seperti itu?
Arnaud A