ANOVA dengan pengamatan non-independen

11

Maaf untuk latar belakang verbose untuk pertanyaan ini:

Kadang-kadang dalam penyelidikan perilaku hewan, seorang peneliti tertarik pada jumlah waktu yang dihabiskan subjek dalam zona yang berbeda, yang telah ditentukan sebelumnya dalam peralatan uji. Saya sering melihat data seperti ini dianalisis menggunakan ANOVA; namun, saya tidak pernah sepenuhnya yakin akan validitas analisis tersebut, mengingat bahwa ANOVA mengasumsikan bahwa pengamatan itu independen, dan mereka tidak pernah benar-benar independen dalam analisis ini (karena lebih banyak waktu yang dihabiskan dalam satu zona berarti lebih sedikit yang dihabiskan di zona lain! ).

Sebagai contoh,

DR Smith, CD Striplin, AM Geller, RB Mailman, J. Drago, CP Lawler, M. Gallagher, Penilaian perilaku tikus yang kekurangan reseptor dopamin D1A , Neuroscience, Volume 86, Edisi 1, 21 Mei 1998, Halaman 135-146

Dalam artikel di atas, mereka mengurangi derajat kebebasan sebesar 1 untuk mengkompensasi ketidak-merdeka. Namun, saya tidak yakin bagaimana manipulasi semacam itu dapat benar-benar memperbaiki pelanggaran asumsi ANOVA ini.

Mungkin prosedur chi-squared mungkin lebih tepat? Apa yang akan Anda lakukan untuk menganalisis data seperti ini (preferensi untuk zona, berdasarkan waktu yang dihabiskan di zona)?

Terima kasih!

Mike Wong
sumber

Jawaban:

3

(Caveat Emptor: Saya bukan ahli di bidang ini)

Jika Anda hanya ingin berbicara tentang perbedaan waktu yang dihabiskan per lokasi, maka mengirimkan data "waktu-per-lokasi" sebagai jumlah dalam model campuran multinomial (lihat paket MCMCglmm untuk R), menggunakan subjek sebagai efek acak, harus dilakukan Trik-nya.

Jika Anda ingin berbicara tentang perbedaan dalam preferensi lokasi melalui waktu, maka mungkin bin time ke interval yang masuk akal (mungkin dengan resolusi perangkat timing Anda?), Mengklasifikasikan setiap interval sesuai dengan lokasi mouse pada waktu itu (mis. Jika 3 lokasi, setiap interval diberi label 1, 2, atau 3), dan sekali lagi menggunakan model efek campuran multinomial dengan subjek sebagai efek acak tetapi kali ini menambahkan interval sebagai efek tetap (meskipun mungkin hanya setelah interval faktorisasi, yang menurunkan daya tetapi harus membantu menangkap non-linearitas melalui waktu).

Mike Lawrence
sumber
5

Mike,

Saya setuju bahwa ANOVA berdasarkan waktu total mungkin bukan pendekatan yang tepat di sini. Selanjutnya, saya tidak yakin bahwa Chi Sqaure menyelesaikan masalah Anda. Chi square akan menghormati gagasan bahwa Anda tidak dapat berada di dua lokasi pada saat yang sama, tetapi itu tidak mengatasi masalah bahwa ada kemungkinan ketergantungan antara waktu N dan waktu N +1. Sehubungan dengan masalah kedua ini, saya melihat beberapa analogi antara situasi Anda dan apa yang orang hadapi dengan data pelacakan mata dan mouse. Model multinomial dari beberapa jenis dapat melayani tujuan Anda dengan baik. Sayangnya, detail model seperti itu berada di luar keahlian saya. Saya yakin beberapa buku statistik di suatu tempat memiliki primer kecil yang bagus tentang topik itu, tetapi dari atas kepala saya, saya akan mengarahkan Anda ke:

  • Barr DJ (2008) Menganalisis data eyetracking 'dunia visual' menggunakan regresi logistik multilevel. Jurnal Memori dan Bahasa, Edisi Khusus: Analisis Data Emerging (59) hal 457-474
  • https://r-forge.r-project.org/projects/gmpm/ adalah pendekatan non-parametrik untuk masalah yang sama yang sedang dikembangkan oleh Dr. Barr

Jika ada, kedua sumber itu harus lebih dari lengkap karena mereka masuk ke bagaimana menganalisis perjalanan waktu posisi.

russellpierce
sumber
4

Lihatlah ke model dengan kesalahan yang berhubungan secara spasial (dan kovariat berkorelasi spasial). Pengantar singkat, dengan referensi ke GeoDa , tersedia di sini . Ada banyak teks; yang bagus adalah karya Noel Cressie , Robert Haining , dan Fotheringham et al (tautan terakhir menuju ringkasan, bukan situs buku). Beberapa kode R baru-baru ini muncul tetapi saya tidak terbiasa dengannya.

whuber
sumber
3

Saya akan menyarankan jawaban yang sangat berbeda dari ANOVA tradisional. Biarkan T menjadi total waktu yang tersedia bagi seekor hewan untuk dihabiskan di semua zona. Anda dapat mendefinisikan T sebagai jumlah total waktu bangun atau semacamnya. Misalkan Anda memiliki zona J. Maka menurut definisi Anda memiliki:

Jumlah T_j = T

Anda bisa menormalkan di atas dengan membagi lhs dan rhs dengan T dan Anda dapatkan

Jumlah P_j = 1

di mana P_j adalah proporsi waktu yang dihabiskan hewan di zona j.

Sekarang pertanyaan yang Anda miliki adalah apakah P_j berbeda secara signifikan dari 1 / J untuk semua j.

Anda bisa berasumsi bahwa P_j mengikuti distribusi balon dan memperkirakan dua model.

Model Null

Atur parameter distribusi sehingga P_j = 1 / J. (Pengaturan parameter distribusi ke 1 akan dilakukan.)

Model Alternatif

Atur parameter distribusi menjadi fungsi kovariat zona khusus. Anda kemudian dapat memperkirakan parameter model.

Anda akan memilih model alternatif jika itu mengungguli model nol pada beberapa kriteria (misalnya, rasio kemungkinan).


sumber