Menyesuaikan GLMM binomial (glmer) ke variabel respons yang proporsional atau fraksi

11

Saya berharap seseorang dapat membantu dengan apa yang saya pikir merupakan pertanyaan yang relatif sederhana, dan saya pikir saya tahu jawabannya tetapi tanpa konfirmasi itu sudah menjadi sesuatu yang saya tidak bisa yakin.

Saya memiliki beberapa data hitungan sebagai variabel respon dan saya ingin mengukur bagaimana variabel itu berubah dengan kehadiran proporsional dari sesuatu.

Secara lebih rinci, variabel respon adalah jumlah keberadaan spesies serangga di sejumlah lokasi, jadi misalnya situs diambil sampelnya 10 kali dan spesies ini dapat terjadi 4 kali.

Saya ingin melihat apakah ini berkorelasi dengan keberadaan proporsional sekelompok spesies tanaman dalam komunitas tanaman secara keseluruhan di lokasi-lokasi ini.

Ini berarti data saya terlihat sebagai berikut (ini hanya sebuah contoh)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

Data juga termasuk efek acak untuk lokasi.

Saya memikirkan dua metode, satu akan menjadi model linier ( lmer) dengan serangga dikonversi ke proporsi misalnya

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

Yang kedua akan menjadi GLMM binomial ( glmer) misalnya

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

Saya percaya binomial glmer menjadi metode yang benar, namun mereka menghasilkan hasil yang sangat berbeda. Saya sepertinya tidak dapat menemukan jawaban yang pasti di internet tanpa merasa sedikit tidak pasti, dan ingin memastikan saya tidak membuat kesalahan.

Setiap bantuan atau wawasan tentang metode alternatif tentang ini akan sangat dihargai.

AL
sumber

Jawaban:

19

GLMM binomial mungkin adalah jawaban yang tepat.

  • Terutama dengan jumlah sampel yang kecil hingga sedang (9 dan 10 dalam contoh Anda), distribusi variabel respons mungkin akan heteroscedastic (varians tidak akan konstan, dan khususnya akan tergantung pada rata-rata dalam cara sistematis) dan jauh dari Normality, dengan cara yang akan sulit untuk ditransformasikan - terutama jika proporsinya mendekati 0 atau 1 untuk beberapa nilai variabel prediktor. Itu membuat GLMM ide yang bagus.
  • Anda harus berhati-hati untuk memeriksa / memperhitungkan penyebaran berlebihan. Jika Anda memiliki pengamatan tunggal (yaitu sampel binomial tunggal / baris dalam bingkai data Anda) per lokasi maka (1|Site)efek acak Anda akan secara otomatis menangani ini (meskipun lihat Harrison 2015 untuk catatan peringatan)
  • jika asumsi sebelumnya benar (Anda hanya memiliki satu sampel binomial per lokasi), maka Anda juga dapat memasukkannya sebagai model binomial biasa ( glm(...,family=binomial)- dalam hal ini Anda juga dapat menggunakan model kuasibinomial ( family=quasibinomial) sebagai cara alternatif yang lebih sederhana dan alternatif untuk memperhitungkan penyebaran berlebihan
  • jika Anda suka, Anda juga dapat menyesuaikan GLMM Anda dengan proporsi sebagai respons, jika Anda menetapkan weightsargumen untuk sama dengan jumlah sampel:

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (ini harus memberikan hasil yang identik dengan glmer()kecocokan yang Anda miliki dalam pertanyaan Anda).

Harrison, Xavier A. " Perbandingan Efek Acak Tingkat Observasi dan Model Beta-Binomial untuk Pemodelan Overdispersi dalam Data Binomial dalam Ekologi dan Evolusi ." PeerJ 3 (21 Juli 2015): e1114. doi: 10.7717 / peerj.1114.

Ben Bolker
sumber
Hai Ben, Terima kasih banyak atas jawaban Anda yang jelas dan komprehensif!
AL