Bagaimana cara saya menafsirkan 'korelasi efek tetap' dalam output glmer saya?

26

Saya memiliki output sebagai berikut:

Generalized linear mixed model fit by the Laplace approximation 
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) 

 AIC   BIC    logLik deviance
 4062  4093  -2022   4044

Random effects:
Groups    Name        Variance Std.Dev.
landscape (Intercept) 0.82453  0.90804 
Number of obs: 239, groups: landscape, 45

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  2.65120    0.14051  18.868   <2e-16     
sMFS2        0.26922    0.17594   1.530   0.1260    
sAG2         0.09268    0.14529   0.638   0.5235    
sSHDI2       0.28345    0.17177   1.650   0.0989  
sbare        0.41388    0.02976  13.907   <2e-16 
seasonlate  -0.50165    0.02729 -18.384   <2e-16 
cropforage   0.79000    0.06724  11.748   <2e-16 
cropsoy      0.76507    0.04920  15.551   <2e-16 

Correlation of Fixed Effects:
           (Intr) sMFS2  sAG2   sSHDI2 sbare  sesnlt crpfrg
sMFS2      -0.016                                          
sAG2        0.006 -0.342                                   
sSHDI2     -0.025  0.588 -0.169                            
sbare      -0.113 -0.002  0.010  0.004                     
seasonlate -0.034  0.005 -0.004  0.001 -0.283              
cropforage -0.161 -0.005  0.012 -0.004  0.791 -0.231       
cropsoy    -0.175 -0.022  0.013  0.013  0.404 -0.164  0.557

Semua variabel kontinu saya (dilambangkan dengan kecil ssebelum nama variabel) distandarisasi (skor-z). seasonadalah variabel kategori dengan 2 level (awal dan akhir), dan cropmerupakan variabel kategori dengan 3 level (jagung, hijauan, dan kedelai).

Matriks korelasi efek tetap ini benar-benar membingungkan saya, karena semua korelasi memiliki tanda sebaliknya yang mereka lakukan ketika saya melihat regresi sederhana dari pasangan variabel. yaitu, korelasi matriks efek tetap menunjukkan korelasi positif yang kuat antara cropforagedan sbare, padahal sebenarnya ada korelasi NEGATIF ​​yang sangat kuat antara variabel-variabel ini - tanaman hijauan cenderung memiliki tanah kosong jauh lebih sedikit dibandingkan dengan tanaman jagung dan kedelai. Pasangan variabel kontinu memiliki masalah yang sama, korelasi matriks efek tetap mengatakan segala sesuatu adalah kebalikan dari yang seharusnya ... Mungkinkah ini hanya karena kompleksitas model (bukan menjadi regresi sederhana)? Mungkinkah ada hubungannya dengan fakta bahwa variabel standar?

Terima kasih.

susie
sumber

Jawaban:

27

Output "korelasi efek tetap" tidak memiliki makna intuitif yang sebagian besar akan menganggapnya. Secara khusus, ini bukan tentang korelasi variabel (seperti catatan OP). Ini sebenarnya tentang korelasi yang diharapkan dari koefisien regresi. Meskipun ini mungkin berbicara dengan multikolinieritas, itu tidak harus. Dalam hal ini ia memberi tahu Anda bahwa jika Anda melakukan percobaan lagi dan kebetulan koefisien untuk cropforagesemakin kecil, kemungkinan juga akan terjadi koefisien sbare.

Pada bagian bukunya "Menganalisis Data Linguistik: Pengantar Praktis untuk Statistik menggunakan R" berurusan dengan lme4 Baayen menekan bagian output dan menyatakan itu hanya berguna dalam kasus-kasus khusus. Berikut adalah pesan listserv di mana Bates sendiri menjelaskan cara menafsirkan bagian output itu:

Ini adalah perkiraan korelasi dari estimator efek tetap. (Saya memasukkan kata "perkiraan" karena saya harus tetapi dalam hal ini aproksimasi sangat baik.) Saya tidak yakin bagaimana menjelaskannya lebih baik dari itu. Misalkan Anda mengambil sampel MCMC dari parameter dalam model, maka Anda akan mengharapkan sampel parameter efek tetap untuk menampilkan struktur korelasi seperti matriks ini.

russellpierce
sumber
3
Maaf, ini mungkin pertanyaan konyol, tapi mengapa penting untuk mempertimbangkan korelasi itu? Maksud saya, dalam situasi apa output harus dipertimbangkan?
mtao
1
@Teresa Tergantung pada apa Anda menggunakannya. Jika Anda peduli dengan interpretasi, maka itu memberi tahu Anda tentang betapa membingungkannya dua sumber efek. Jika Anda peduli tentang prediksi, ini memberi tahu Anda sedikit tentang seperti apa model prediksi lain dan memberi Anda beberapa petunjuk tentang bagaimana model tersebut dapat berubah jika Anda menjatuhkan prediktor.
russellpierce
1
Jadi, bayangkan saya memiliki dua variabel dalam output itu dengan korelasi 0,90, misalnya. Dalam hal penafsiran, saya menganggap saya harus menjatuhkan salah satu dari mereka, karena mereka "membingungkan" dan tampaknya mengatakan informasi yang sama. Adapun prediksi, jika saya menjatuhkan salah satu dari mereka, model lain tidak boleh banyak berubah, karena mereka berkorelasi, apakah saya benar? Atau apakah saya salah menafsirkan ini?
mtao
3
Anda tahu, saya pikir Anda menggemakan apa yang saya katakan dengan benar; tetapi, pada refleksi saya tidak yakin 100p saya benar. Anda mungkin paling baik dilayani dengan membuka pertanyaan baru - yang akan mendapatkan lebih banyak perhatian pada pertanyaan Anda dan meningkatkan kemungkinan Anda menerima jawaban yang benar.
russellpierce
1
@ russellpierce, terima kasih atas jawaban ini. Namun satu pertanyaan, saya belajar bahwa multikolinearitas terjadi ketika prediktor berkorelasi satu sama lain. Tetapi dalam jawaban Anda, Anda mengatakan bahwa itu adalah korelasi dari koefisien regresi (bukan prediktor) yang dapat berbicara dengan multikolinieritas. Mengapa tidak hanya mengkorelasikan prediktor itu sendiri dan bukan koefisien yang diperkirakan?
locus
0

Jika korelasi negatif dan positif Anda sama nilainya dan hanya tandanya berbeda, Anda memasukkan variabel secara keliru. Tapi saya tidak berpikir ini adalah kasus untuk Anda karena Anda sudah cukup maju dalam statistik.

Ketidakkonsistenan yang Anda alami dapat dan kemungkinan disebabkan oleh multikolinieritas. Ini berarti ketika beberapa variabel independen berbagi beberapa efek yang tumpang tindih, atau dengan kata lain dikorelasikan sendiri. misalnya pemodelan untuk variabel "laju pertumbuhan" dan "ukuran tumor" dapat menyebabkan multikolinieritas, karena dimungkinkan dan kemungkinan bahwa tumor yang lebih besar memiliki tingkat pertumbuhan yang lebih tinggi (sebelum terdeteksi) per se. Ini dapat membingungkan model. Dan jika model Anda memiliki beberapa variabel independen yang saling berkorelasi, menafsirkan hasilnya terkadang menjadi sangat sulit. Kadang-kadang mengarah pada koefisien yang benar-benar aneh, bahkan sampai pada batas tertentu sehingga tanda beberapa korelasi berbalik.

Anda harus terlebih dahulu mendeteksi sumber multikolinieritas dan menanganinya dan kemudian jalankan kembali analisis Anda.

Vic
sumber
1
-1; menyesatkan. OP tidak memasukkan variabelnya secara salah dan multikolinieritas mungkin tidak menjadi masalah. Korelasi antara efek baku tetap mungkin berbicara ke titik ini, tetapi paradoks Simpson memungkinkan pendekatan itu untuk mengarahkan Anda ke arah yang salah.
russellpierce
1
Kenapa "menyesatkan"? Bagian mana yang menyesatkan? Saya berbicara dengan sangat jelas dan menghindari kesimpulan yang jelas. Apa yang saya katakan memang salah satu tanda multikolinieritas dan memberi tahu kita bahwa kita harus memeriksa VIF juga. Tetapi saya tidak mengerti bagaimana Anda tahu atau yakin bahwa "OP tidak memasukkan variabelnya dengan tidak benar dan multikolinieritas mungkin tidak menjadi masalah."?
Vic
1
Selain itu Anda bahkan belum membaca posting saya sepenuhnya (dan menurunkannya dan menyebutnya menyesatkan). Jika ya, Anda telah melihat bahwa saya telah menyarankan bahwa OP harus memeriksa VIF (sebagai indikator resmi untuk multiC) untuk memastikan apakah korelasi tinggi tersebut benar-benar mengarah ke MC atau tidak? tetapi bagaimanapun, saya terbuka untuk belajar selama itu bebas dari kesombongan dan serangan pribadi.
Vic
1
@Vic: Tidak melihat komentar Anda sampai sekarang. Saya tidak bermaksud agar Anda melihat tanggapan saya sebagai serangan pribadi. Saya berpendapat itu menyesatkan dan saya memberikan apa yang saya yakini sebagai jawaban yang benar di atas. Saya membaca posting Anda secara keseluruhan pada saat itu. Saya tidak tahu apakah saya menggali komentar atau tidak. Saya mendukung downvote saya.
russellpierce
1
... tapi saya mengizinkan saya mungkin salah dalam penilaian itu. Namun, sepertinya lebih baik untuk menjelaskan mengapa saya downvote daripada hanya downvote.
russellpierce
0

Akan sangat membantu untuk menunjukkan bahwa korelasi antara efek tetap diperoleh dengan mengubah "vcov" model ke matriks korelasi. Jikafit model lme4 Anda terpasang, maka

vc <- vcov(fit)

# diagonal matrix of standard deviations associated with vcov
S <- sqrt(diag(diag(vc), nrow(vc), nrow(vc)))

# convert vc to a correlation matrix
solve(S) %*% vc %*% solve(S)

dan korelasi antara efek tetap adalah entri off-diagonal.

Ed Merkle
sumber