Menafsirkan model rata-rata hasil dalam R

11

Saya mencoba memahami dan tahu apa yang harus dilaporkan dari analisis saya tentang beberapa data menggunakan model rata-rata di R.

Saya menggunakan skrip berikut untuk menganalisis pengaruh metode pengukuran terhadap variabel yang diberikan: Berikut adalah dataset: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Model yang akan dipasang:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

mengeruk model penuh

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Dapatkan informasi ringkasan semua model untuk mendapatkan estimasi parameter

summary(model.avg(d))

Saya tahu bahwa semua model dapat rata-rata (model penuh rata-rata) atau hanya sebagian dari mereka (rata-rata kondisional). Sekarang, saya ingin tahu: kapan lebih baik menggunakan rata-rata penuh atau bersyarat untuk membuat kesimpulan. Apa yang harus saya laporkan dari semua ini untuk artikel ilmiah? Apa yang berarti persis nilai Z dan p terkait untuk situasi rata-rata model?

Untuk mempermudah memvisualisasikan pertanyaan saya. Ini adalah tabel hasil,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4
Agus Camacho
sumber

Jawaban:

5

Lihat Grueber et al. 2011, "Multimodel inferensi dalam ekologi dan evolusi: tantangan dan solusi" Evolutionary Biology 24: 699-711.

Ini benar-benar tergantung pada tujuan, apakah Anda ingin menggunakan data penuh atau bersyarat. Di bidang saya, kami akan menggunakan kriteria, seperti AICC untuk menentukan model mana yang paling didukung, kemudian menggunakannya sebagai subset bersyarat Anda. Informasi ini kemudian akan dilaporkan. Misalnya, empat model pertama Anda semuanya berada dalam 2 unit AIC satu sama lain, sehingga semuanya akan dimasukkan dalam subset Anda. Yang lain jauh di luar sana (AIC lebih tinggi) sehingga memasukkan informasi dari mereka sebenarnya akan mengurangi kualitas perkiraan beta Anda.

AUDeer
sumber
2
Bahkan dalam contoh yang Anda sarankan, akan ada beberapa istilah yang muncul di mungkin dua dari empat model "terbaik". Apakah Anda mengambil rata-rata dari dua nilai koefisien, atau dua nilai dan dua nilai nol untuk dua model di mana mereka tidak muncul?
user2390246
5

Saya pikir premis tentang perbedaan antara apa yang rata-rata penuh dan bersyarat adalah salah. Satu adalah rata-rata yang mencakup nol (penuh) dan satu tidak termasuk nol (bersyarat). dari file bantuan untuk perintah model.avg ():

Catatan

Rata-rata 'subset' (atau 'conditional') hanya rata-rata di atas model tempat parameter muncul. Alternatif, rata-rata 'penuh' mengasumsikan bahwa variabel dimasukkan dalam setiap model, tetapi dalam beberapa model koefisien yang sesuai (dan varians masing-masing) diatur ke nol. Berbeda dengan 'rata-rata subset', ia tidak memiliki kecenderungan untuk menyamakan nilai dari nol. Rata-rata 'penuh' adalah jenis penaksir penyusutan dan untuk variabel dengan hubungan yang lemah dengan respons, mereka lebih kecil daripada penaksir 'subset'.

Jika Anda hanya ingin menggunakan subset model (berdasarkan delta AIC misalnya), gunakan argumen subset di model.avg (). Anda masih akan mendapatkan estimasi bersyarat dan penuh, selama beberapa model yang disertakan kehilangan beberapa variabel yang dimiliki orang lain.

Joe Sapp
sumber
Iya. Saya setuju. Itu adalah interpretasi yang tepat.
ahli