Kapan memasukkan efek acak dalam suatu model

9

Saya baru mengenal pemodelan campuran dan saya bingung apakah perlu menggunakan efek acak dalam analisis yang saya lakukan. Nasihat apa pun akan dihargai.

penelitian saya menguji seberapa baik indeks kelimpahan mamalia yang baru dikembangkan dapat memprediksi nilai dari indeks padat karya yang lebih mapan. Saya telah mengukur indeks ini di beberapa patch hutan, dengan beberapa plot di setiap patch hutan.

karena saya tidak secara langsung tertarik pada efek patch hutan, dan karena plot sampel saya bersarang di dalam patch hutan, saya sudah menggunakan patch hutan sebagai efek acak. Namun, saya punya beberapa pertanyaan tentang ini:

pertama, saya tahu bahwa efek acak memungkinkan Anda untuk menggeneralisasi hasil Anda di semua tingkat yang mungkin dari faktor acak, bukan hanya yang Anda sampel. tetapi bagi saya tampaknya untuk membuat inferensi semacam ini level Anda harus diambil secara acak? Patch hutan saya tidak diambil secara acak, jadi bisakah saya masih menggunakannya sebagai efek acak?

kedua, saya pernah membaca bahwa Anda dapat menguji apakah perlu memiliki efek acak dengan melakukan misalnya uji rasio kemungkinan untuk membandingkan model dengan dan tanpa efek. Saya telah melakukan ini, dan itu menunjukkan bahwa model efek acak tidak menjelaskan data serta model hanya efek tetap. Masalah saya dengan ini adalah bahwa plot saya masih bersarang di dalam patch hutan, dan mungkin tidak independen. jadi, bisakah saya menggunakan pendekatan LRT ini untuk membenarkan mengecualikan efek acak, atau apakah saya masih perlu memasukkannya ke akun untuk bersarang? dan jika saya akhirnya menghilangkan efek acak, apakah ada cara untuk memverifikasi bahwa plot dalam patch hutan dapat dianggap independen?

Terima kasih atas bantuan Anda!

Jay

jay
sumber
Saya pikir hal konseptual utama dengan efek acak adalah bahwa mereka semua harus tentang besarnya yang sama dan dapat ditukar - ini adalah apa yang membuat kesimpulan tentang efek acak non-sampel menjadi mungkin. Selain itu, Anda harus berhati-hati menggunakan tes LR untuk efek acak karena mungkin ada ketidakpastian yang cukup besar mengenai komponen varians bahkan jika estimasi ML / REML adalah nol atau mendekati nol.
probabilityislogic
Terima kasih banyak untuk itu. Jadi akan ada cara untuk bekerja jika perlu untuk menjaga efek acak?
jay
Dari apa yang saya mengerti, yang terbaik adalah tidak melakukan perbandingan LR dengan model yang sesuai dengan REML. Di L Rmer, misalnya, Anda harus mengatur REML = FALSE saat melakukan LRT. (Ini default ke TRUE, yang sebaliknya lebih baik.)
Wayne

Jawaban:

6

Seperti yang saya pahami, Anda memiliki desain pengamatan bersarang sederhana (plot dalam tambalan) dan minat Anda adalah pada korelasi / regresi antara dua variabel kontinu (dua indeks). Ukuran sampel Anda adalah m tambalan xn plot = N pasangan pengamatan (atau sumatif yang sesuai jika tidak seimbang). Tidak ada pengacakan yang tepat yang terlibat, tetapi mungkin Anda dapat / harus / ingin mempertimbangkan bahwa (1) tambalan "secara acak" dipilih dari semua tambalan semacam ini atau di beberapa area, dan kemudian (2) plot itu "secara acak" dipilih dalam setiap tambalan.

Jika Anda mengabaikan Patch faktor acak, Anda mungkin pseudoreplikasi dengan mempertimbangkan bahwa Anda telah secara acak memilih plot N "bebas", tanpa membatasi mereka menjadi (dalam jumlah atau jenis) pada patch-patch yang (sebelumnya) dipilih.

Jadi, pertanyaan pertama Anda: ya, itulah yang dimungkinkan oleh faktor acak. Validitas kesimpulan seperti itu bergantung pada validitas asumsi bahwa pemilihan serampangan sama dengan pemilihan acak tambalan (misalnya, bahwa hasil Anda tidak akan berbeda jika serangkaian tambalan hutan yang berbeda dipilih). Hal itu juga membatasi ruang inferensi Anda: jenis hutan atau area geografis hingga sejauh mana hasil Anda bergantung pada populasi tambalan (imajiner) maksimal tempat sampel Anda merupakan sampel "acak" yang kredibel. Mungkin pengamatan Anda adalah sampel mamalia hutan yang "masuk akal" di wilayah Anda, tetapi akan menjadi sampel agregat mencurigakan dari mamalia di seluruh benua.

Yang kedua: tes akan tergantung pada "tingkat pseudoreplication", atau bukti dalam sampel Anda bahwa plot "milik" tambalan. Ini adalah, berapa banyak variasi yang ada di antara tambalan dan di antara plot dalam tambalan (mencari korelasi intraclass). Secara ekstrim, hanya variasi di antara tambalan yang ada (plot dalam tambalan semuanya sama) dan Anda memiliki "pseudoreplikasi murni": N Anda harus berupa jumlah tambalan, dan pengambilan sampel satu atau banyak plot dari masing-masing tambalan tidak memberikan informasi baru. Di sisi lain, semua variasi terjadi di antara plot, dan tidak ada variasi tambahan yang dijelaskan dengan mengetahui di mana patch hutan dimiliki oleh masing-masing plot (dan kemudian model tanpa faktor acak akan tampak lebih pelit); Anda memiliki plot "independen". TIDAK ada yang ekstrem yang sangat mungkin terjadi ... terutama untuk variabel biologis yang diamati di lapangan, jika hanya karena autokorelasi spasial dan distribusi geografis mamalia. Saya pribadi lebih suka menjaga faktor-faktor dengan desain (misalnya, bahkan ketika tambalan bukan sumber variasi yang relevan DI SAMPEL INI) untuk mempertahankan analogi "eksperimental-pengamatan" yang dijelaskan di atas; ingat: tidak memiliki bukti dalam sampel Anda untuk menolak hipotesis nol bahwa variasi di antara tambalan adalah nol tidak berarti bahwa variasi adalah nol dalam populasi. bahkan ketika tambalan bukan sumber variasi relevan dalam SAMPEL INI) untuk mempertahankan analogi "eksperimental-observasional" yang dijelaskan di atas; ingat: tidak memiliki bukti dalam sampel Anda untuk menolak hipotesis nol bahwa variasi di antara tambalan adalah nol tidak berarti bahwa variasi adalah nol dalam populasi. bahkan ketika tambalan bukan sumber variasi relevan dalam SAMPEL INI) untuk mempertahankan analogi "eksperimental-observasional" yang dijelaskan di atas; ingat: tidak memiliki bukti dalam sampel Anda untuk menolak hipotesis nol bahwa variasi di antara tambalan adalah nol tidak berarti bahwa variasi adalah nol dalam populasi.

FairMiles
sumber