Saya memiliki data untuk populasi sejumlah ikan yang berbeda, yang diambil sampelnya selama sekitar 5 tahun, tetapi dalam pola yang sangat tidak teratur. Kadang-kadang ada bulan antara sampel, kadang-kadang ada beberapa sampel dalam satu bulan. Ada juga banyak 0 hitungan
Bagaimana cara menangani data seperti itu?
Saya dapat membuat grafik dengan cukup mudah di R, tetapi grafiknya tidak terlalu menyinari, karena sangat bergelombang.
Dalam hal pemodelan - dengan spesies yang dimodelkan sebagai fungsi dari berbagai hal - mungkin model campuran (model multilevel alias).
Setiap referensi atau ide disambut
Beberapa detail menanggapi komentar
Ada sekitar 15 spesies.
Saya mencoba untuk mendapatkan ide tentang tren atau musim pada setiap ikan, dan melihat bagaimana spesies terkait satu sama lain (klien saya awalnya ingin tabel korelasi sederhana)
Tujuannya adalah deskriptif dan analitik, bukan prediksi
Suntingan lebih lanjut: Saya menemukan makalah ini oleh K. Rehfield et al., Yang menyarankan penggunaan kernel Gaussian untuk memperkirakan ACF untuk rangkaian waktu yang sangat tidak teratur
http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf
sumber
Jawaban:
Saya telah menghabiskan cukup banyak waktu membangun kerangka umum untuk rangkaian waktu yang tidak merata: http://www.eckner.com/research.html
Selain itu, saya telah menulis makalah tentang tren dan perkiraan musiman untuk rangkaian waktu yang tidak rata.
Saya harap Anda akan menemukan hasilnya bermanfaat!
sumber
Saya tidak tahu apakah model campuran sangat tepat (menggunakan paket standar di mana struktur efek acak adalah prediktor linier), kecuali Anda berpikir bahwa data pada semua titik waktu harus dapat saling dipertukarkan dalam beberapa hal (dalam hal ini) interval ireguler adalah bukan masalah) - itu tidak akan benar-benar menjadi model autokorelasi temporal dengan cara yang masuk akal. Mungkin saja Anda bisa menipu Lmer () untuk melakukan semacam hal autogresif tetapi bagaimana tepatnya Anda melakukan hal itu luput dari saya sekarang (saya mungkin tidak berpikir jernih). Juga, saya tidak yakin apa yang akan "variabel pengelompokan" yang menginduksi autokorelasi dalam skenario model campuran.
Jika autokorelasi temporal adalah parameter gangguan dan Anda tidak mengharapkannya jugabesar, maka Anda bisa mengolah data menjadi zaman yang pada dasarnya terpisah satu sama lain dalam hal korelasi (misalnya, pisahkan deret waktu pada titik-titik di mana tidak ada data berbulan-bulan) dan menganggapnya sebagai ulangan independen. Anda kemudian dapat melakukan sesuatu seperti GEE pada set data yang dimodifikasi ini di mana "cluster" didefinisikan oleh zaman Anda berada, dan entri dari matriks korelasi kerja adalah fungsi dari seberapa jauh jarak pengamatan dibuat. Jika fungsi regresi Anda benar, maka Anda masih akan mendapatkan estimasi yang konsisten dari koefisien regresi, bahkan jika struktur korelasi salah ditentukan. Ini juga akan memungkinkan Anda untuk memodelkannya sebagai data penghitungan menggunakan, misalnya, log-link (seperti biasanya dalam regresi poisson). Anda juga dapat membangun beberapa korelasi diferensial antara spesies, di mana setiap titik waktu dipandang sebagai vektor multivariat dari spesies diperhitungkan dengan beberapa hubungan peluruhan sementara di antara titik waktu. Ini akan membutuhkan beberapa pra-pemrosesan untuk mengelabui paket GEE standar untuk melakukan ini.
Jika autokorelasi temporal bukan parameter gangguan, saya akan mencoba sesuatu yang lebih seperti model kovarians terstruktur di mana Anda melihat seluruh dataset sebagai satu pengamatan vektor multivariat besar sehingga kovarians antar pengamatan pada spesies adalah u , vYs,Yt u,v
di mana adalah beberapa fungsi parametrik yang diketahui hingga sejumlah parameter, , bersama dengan sejumlah parameter untuk mengatur struktur rata-rata. Anda mungkin perlu "membangun sendiri" untuk model seperti ini, tetapi saya juga tidak akan terkejut jika ada paket MPLUS untuk melakukan hal-hal seperti ini untuk data jumlah.θf θ
sumber
surveillance
paket mungkin memiliki fungsi yang diinginkan. Pemodelan semacam ini tidak biasa dalam studi ekologi, jadi mungkin yang terbaik untuk menemukan paket yang baik di sudut ekologi CRAN.