Mengapa Anova () dan drop1 () memberikan jawaban berbeda untuk GLMM?

10

Saya memiliki GLMM formulir:

lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + 
                (1 | factor3), family=binomial)

Ketika saya menggunakan drop1(model, test="Chi"), saya mendapatkan hasil yang berbeda daripada jika saya menggunakan Anova(model, type="III")dari paket mobil atau summary(model). Dua yang terakhir ini memberikan jawaban yang sama.

Menggunakan banyak data yang dibuat, saya telah menemukan bahwa kedua metode ini biasanya tidak berbeda. Mereka memberikan jawaban yang sama untuk model linier seimbang, model linier tidak seimbang (di mana tidak sama n dalam kelompok yang berbeda), dan untuk model linier umum seimbang, tetapi tidak untuk model campuran linier umum yang seimbang. Jadi nampak bahwa hanya dalam kasus-kasus di mana faktor acak dimasukkan tidak perselisihan ini bermanifestasi.

  • Mengapa ada perbedaan antara kedua metode ini?
  • Kapan menggunakan GLMM harus Anova()atau drop1()digunakan?
  • Perbedaan antara keduanya agak sedikit, setidaknya untuk data saya. Apakah itu penting yang digunakan?
tim.farkas
sumber

Jawaban:

7

Saya pikir ini adalah perbedaan tes yang dihitung. car::Anovamenggunakan tes Wald, sedangkan drop1model mereparasi menjatuhkan istilah tunggal. John Fox pernah menulis kepada saya, bahwa tes dan tes Wald dari model yang dipasang menggunakan tes rasio kemungkinan (yaitu, strategi dari drop1) setuju untuk model linier tetapi tidak harus non-linier. Sayangnya surat ini tidak terdaftar dan tidak mengandung referensi apa pun. Tetapi saya tahu bahwa bukunya memuat bab tentang tes Wald, yang bisa berisi info yang diinginkan.

Bantuan untuk car::Anovamengatakan:

Tes Tipe-II dihitung sesuai dengan prinsip marginalitas, menguji setiap istilah setelah yang lainnya, kecuali mengabaikan kerabat tingkat tinggi istilah; yang disebut tes tipe-III melanggar marginalitas, menguji setiap istilah dalam model setelah semua yang lain. Definisi tes Tipe-II ini sesuai dengan tes yang diproduksi oleh SAS untuk model analisis varians, di mana semua prediktor adalah faktor, tetapi tidak lebih umum (yaitu, ketika ada prediktor kuantitatif). Berhati-hatilah dalam merumuskan model untuk tes tipe-III, atau hipotesis yang diuji tidak masuk akal.

Sayangnya saya tidak bisa menjawab pertanyaan kedua atau ketiga Anda karena saya juga ingin tahu itu.


Perbarui mengatur ulang komentar :

Tidak ada tes Wald, LR dan F untuk model campuran umum. Anovahanya memungkinkan untuk "chisq"dan "F"menguji model campuran (yaitu "mer"objek yang dikembalikan oleh lmer). Bagian penggunaan mengatakan:

## S3 method for class 'mer'
Anova(mod, type=c("II","III", 2, 3), 
    test.statistic=c("chisq", "F"), vcov.=vcov(mod), singular.ok, ...)

Tetapi karena uji-F untuk merobjek dihitung oleh pbkrtest, yang untuk pengetahuan saya hanya berfungsi untuk model campuran linier, Anovauntuk GLMM harus selalu kembali chisq(maka Anda tidak melihat perbedaan).

Pembaruan terkait pertanyaan:

Jawaban saya sebelumnya hanya mencoba menjawab pertanyaan utama Anda, perbedaan antara Anova()dan drop1(). Tapi sekarang saya mengerti bahwa Anda ingin menguji apakah efek tetap tertentu signifikan atau tidak. The R-sig-campuran pemodelan FAQ mengatakan berikut mengenai hal ini:

Tes parameter tunggal

Dari yang terburuk hingga yang terbaik:

  • Wald Z-tes
  • Untuk LMM seimbang dan bersarang tempat df dapat dihitung: Wald t-tes
  • Uji rasio kemungkinan, baik dengan mengatur model sehingga parameter dapat diisolasi / dijatuhkan (melalui anova atau drop1), atau melalui komputasi profil kemungkinan
  • Interval kepercayaan bootstrap MCMC atau parametrik

Tes efek (yaitu pengujian bahwa beberapa parameter secara bersamaan nol)

Dari yang terburuk hingga yang terbaik:

  • Tes chi chi-square (mis. Mobil :: Anova)
  • Tes rasio kemungkinan (via anova atau drop1)
  • Untuk LMM seimbang dan bersarang tempat df dapat dihitung: uji F bersyarat
  • Untuk LMM: uji F bersyarat dengan koreksi df (mis. Kenward-Roger dalam paket pbkrtest)
  • MCMC atau parametrik, atau nonparametrik, perbandingan bootstrap (bootstrap nonparametrik harus diimplementasikan dengan hati-hati untuk memperhitungkan faktor pengelompokan)

(penekanan ditambahkan)

Ini menunjukkan bahwa pendekatan Anda car::Anova()untuk menggunakan GLMM umumnya tidak disarankan, tetapi pendekatan menggunakan MCMC atau bootstrap harus digunakan. Saya tidak tahu apakah pvals.fncdari languageRpaket itu bekerja dengan GLMM, tetapi patut dicoba.

Henrik
sumber
1
Terima kasih, Henrik. Anova () dapat menghitung tiga tes yang berbeda: Wald, LR, dan F. Saya sudah mencoba ketiganya, tetapi tidak ada bedanya, yang menurut saya aneh. Saya merasa bahwa fungsinya akan menolak untuk menggunakan tes yang diputuskan tidak sesuai untuk data ...
tim.farkas