Model Efek Campuran dengan Nesting

34

Saya memiliki data yang dikumpulkan dari percobaan yang diselenggarakan sebagai berikut:

Dua situs, masing-masing dengan 30 pohon. 15 dirawat, 15 kontrol di setiap situs. Dari setiap pohon, kami mengambil sampel tiga potong batang, dan tiga potong akar, sehingga 6 tingkat 1 sampel per pohon yang diwakili oleh salah satu dari dua tingkat faktor (akar, batang). Kemudian, dari sampel batang / akar, kami mengambil dua sampel dengan membedah jaringan yang berbeda di dalam sampel, yang diwakili oleh salah satu dari dua tingkat faktor untuk jenis jaringan (tipe jaringan A, tipe jaringan B). Sampel-sampel ini diukur sebagai variabel kontinu. Total jumlah pengamatan adalah 720; 2 situs * 30 pohon * (tiga sampel batang + tiga sampel akar) * (satu sampel jaringan + satu sampel jaringan B). Data terlihat seperti ini ...

        ï..Site Tree Treatment Organ Sample Tissue Total_Length
    1        L  LT1         T     R      1 Phloem           30
    2        L  LT1         T     R      1  Xylem           28
    3        L  LT1         T     R      2 Phloem           46
    4        L  LT1         T     R      2  Xylem           38
    5        L  LT1         T     R      3 Phloem          103
    6        L  LT1         T     R      3  Xylem           53
    7        L  LT1         T     S      1 Phloem           29
    8        L  LT1         T     S      1  Xylem           21
    9        L  LT1         T     S      2 Phloem           56
    10       L  LT1         T     S      2  Xylem           49
    11       L  LT1         T     S      3 Phloem           41
    12       L  LT1         T     S      3  Xylem           30

Saya mencoba menyesuaikan model efek campuran menggunakan R dan lme4, tetapi saya baru untuk model campuran. Saya ingin memodelkan respons sebagai Treatment + Level 1 Factor (batang, akar) + Level 2 Factor (jaringan A, jaringan B), dengan efek acak untuk sampel spesifik yang bersarang dalam dua level.

Di R, saya melakukan ini menggunakan lmer, sebagai berikut

fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample)) 

Dari pemahaman saya (... yang tidak pasti, dan mengapa saya memposting!) Istilah:

(1|Tree/Organ/Sample)

Menentukan bahwa 'Sampel' bersarang di dalam sampel organ, yang bersarang di dalam pohon. Apakah jenis sarang ini relevan / valid? Maaf jika pertanyaan ini tidak jelas, jika demikian, harap tentukan di mana saya dapat menguraikan.

Erik
sumber

Jawaban:

33

Saya pikir ini benar.

  • (1|Tree/Organ/Sample)memperluas ke / sama dengan (1|Tree)+(1|Tree:Organ)+(1|Tree:Organ:Sample)(di mana :menunjukkan interaksi).
  • Faktor-faktor tetap Treatment, Organdan Tissuesecara otomatis ditangani pada tingkat yang benar.
  • Anda mungkin harus memasukkan Sitesebagai efek tetap (secara konseptual ini adalah efek acak, tetapi tidak praktis untuk mencoba memperkirakan varians antar-situs dengan hanya dua situs); ini akan mengurangi varians antar-pohon sedikit.
  • Anda mungkin harus memasukkan semua data dalam bingkai data, dan meneruskannya secara eksplisit lmermelalui data=my.data.frameargumen.

Anda mungkin menemukan FAQ glmm membantu (berfokus pada GLMM tetapi memiliki hal-hal yang juga relevan dengan model campuran linear).

Ben Bolker
sumber
Bagaimana jika Erik ingin menentukan struktur kovarian untuk penyadapan ini? Yaitu orang mungkin mengharapkan sampel dengan Pohon mencegat positif juga memiliki mencegat Organ positif. Apakah sarangnya mengurus masalah ini secara otomatis? Jika tidak, bagaimana orang bisa menentukan struktur seperti itu?
Sheridan Grant
Saya pikir jika Anda mencoba untuk menulis persamaan untuk kasus itu Anda akan menemukan bahwa itu diurus.
Ben Bolker
13

Saya membaca pertanyaan ini dan jawaban Dr. Bolker, dan mencoba mereplikasi data (tidak peduli banyak, terus terang, tentang apa yang "panjang" diwakili dalam istilah atau unit biologis, dan kemudian cocok dengan model seperti di atas. Saya memposting hasilnya di sini untuk berbagi dan mencari umpan balik tentang kemungkinan adanya kesalahpahaman.

Kode yang saya gunakan untuk menghasilkan data fiksi ini dapat ditemukan di sini , dan kumpulan data memiliki struktur bagian dalam OP:

     site     tree treatment organ sample tissue    length
1    L       LT01         T  root      1  phloem  108.21230
2    L       LT01         T  root      1  xylem   138.54267
3    L       LT01         T  root      2  phloem   68.88804
4    L       LT01         T  root      2  xylem   107.91239
5    L       LT01         T  root      3  phloem   96.78523
6    L       LT01         T  root      3  xylem    88.93194
7    L       LT01         T  stem      1  phloem  101.84103
8    L       LT01         T  stem      1  xylem   118.30319

Strukturnya adalah sebagai berikut:

 'data.frame':  360 obs. of  7 variables:
     $ site     : Factor w/ 2 levels "L","R": 1 1 1 1 1 1 1 1 1 1 ...
 $ tree     : Factor w/ 30 levels "LT01","LT02",..: 1 1 1 1 1 1 1 1 1 1 ...
     $ treatment: Factor w/ 2 levels "C","T": 2 2 2 2 2 2 2 2 2 2 ...
 $ organ    : Factor w/ 2 levels "root","stem": 1 1 1 1 1 1 2 2 2 2 ...
     $ sample   : num  1 1 2 2 3 3 1 1 2 2 ...
 $ tissue   : Factor w/ 2 levels "phloem","xylem": 1 2 1 2 1 2 1 2 1 2 ...
     $ length   : num  108.2 138.5 68.9 107.9 96.8 ...

Kumpulan data "dicurangi" (umpan balik di sini akan diterima) sebagai berikut:

  1. Sebab treatment, ada efek tetap dengan dua intersepsi berbeda untuk pengobatan versus kontrol ( 100versus 70), dan tidak ada efek acak.
  2. Saya mengatur nilai-nilai untuk tissuedengan efek tetap yang menonjol dengan intersep yang sangat berbeda untuk phloemversus xylem( 3versus 6), dan efek acak dengan a sd = 3.
  3. organN(0,3)sd = 36rootstem
  4. Untuk treekita hanya punya efek acak dengan a sd = 7.
  5. Karena samplesaya mencoba mengatur hanya efek acak sd = 5.
  6. Untuk untuk siteef hanya juga acak dengan sd = 3.

Tidak ada lereng yang diatur, karena sifat kategorikal variabel.

Hasil model efek campuran:

fit <- lmer(length ~ treatment + organ + tissue + (1|tree/organ/sample), data = trees) 

adalah:

 Random effects:
 Groups              Name        Variance  Std.Dev. 
 sample:(organ:tree) (Intercept) 9.534e-14 3.088e-07
 organ:tree          (Intercept) 0.000e+00 0.000e+00
 tree                (Intercept) 4.939e+01 7.027e+00
 Residual                        3.603e+02 1.898e+01
Number of obs: 360, groups:  sample:(organ:tree), 180; organ:tree, 60; tree, 30

Fixed effects:
            Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  79.8623     2.7011  52.5000  29.567  < 2e-16 ***
treatmentT   21.4368     3.2539  28.0000   6.588 3.82e-07 ***
organstem     0.1856     2.0008 328.0000   0.093    0.926    
tissuexylem   3.1820     2.0008 328.0000   1.590    0.113    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Bagaimana itu bekerja:

  1. Untuk treatmentintersep tanpa pengobatan adalah 79.8623(saya membuat rata-rata 70), dan dengan perawatan itu 79.8623 + 21.4368 = 101.2991(kami membuat rata-rata 100.
  2. Karena tissueada 3.1820kontribusi untuk penyadapan xylem, dan saya telah membuat perbedaan antara phloemdan xylemdari 3. Efek acak bukan bagian dari model.
  3. Sebab organ, sampel dari stempeningkatan intersep oleh 0.1856- saya sudah mengatur tidak ada perbedaan dalam efek tetap antara stemdan root. Deviasi standar dari apa yang ingin saya lakukan sebagai efek acak tidak tercermin.
  4. The treeefek acak dengan sd dari 7muncul baik sebagai 7.027.
  5. Adapun sample, awal sddari 5itu underemphasized sebagai 3.088.
  6. site bukan bagian dari model.

Jadi, secara keseluruhan, tampaknya model tersebut cocok dengan struktur data.

Antoni Parellada
sumber