Rangkaian waktu yang sangat tidak teratur

10

Saya memiliki data untuk populasi sejumlah ikan yang berbeda, yang diambil sampelnya selama sekitar 5 tahun, tetapi dalam pola yang sangat tidak teratur. Kadang-kadang ada bulan antara sampel, kadang-kadang ada beberapa sampel dalam satu bulan. Ada juga banyak 0 hitungan

Bagaimana cara menangani data seperti itu?

Saya dapat membuat grafik dengan cukup mudah di R, tetapi grafiknya tidak terlalu menyinari, karena sangat bergelombang.

Dalam hal pemodelan - dengan spesies yang dimodelkan sebagai fungsi dari berbagai hal - mungkin model campuran (model multilevel alias).

Setiap referensi atau ide disambut

Beberapa detail menanggapi komentar

Ada sekitar 15 spesies.

Saya mencoba untuk mendapatkan ide tentang tren atau musim pada setiap ikan, dan melihat bagaimana spesies terkait satu sama lain (klien saya awalnya ingin tabel korelasi sederhana)

Tujuannya adalah deskriptif dan analitik, bukan prediksi

Suntingan lebih lanjut: Saya menemukan makalah ini oleh K. Rehfield et al., Yang menyarankan penggunaan kernel Gaussian untuk memperkirakan ACF untuk rangkaian waktu yang sangat tidak teratur

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

Peter Flom - Pasang kembali Monica
sumber
1
Saya bukan orang yang tepat untuk menjawab pertanyaan Anda, tetapi model multilevel terdengar masuk akal. Adakah petunjuk tentang seberapa besar sampel itu, berapa banyak spesies yang ada, dan bagaimana angka nol muncul? (Pada poin terakhir, apakah sampel mencoba sampel acak, atau mereka bias, seperti Anda baru saja menghitung dari kontes memancing ikan yang mungkin tidak akan menghasilkan ikan lele?)
Wayne
1
"Berurusan" berarti apa, tepatnya? Untuk beberapa ide tentang mengatasi waktu yang tidak teratur, cari situs ini di "+ waktu + tidak beraturan"
whuber
Bisakah Anda mengklarifikasi pengambilan sampel dan tujuannya? Misalnya, apakah penangkapan-penangkapan ini kembali? Apakah jaring ditempatkan dalam aliran selama periode waktu tertentu, tanpa rilis? Apakah Anda mencoba memperkirakan ukuran sampel di masa mendatang atau populasi yang lebih besar dari mana sampel diambil? Apakah sampel dari 1 atau beberapa lokasi? Tidak ada yang salah dengan deret waktu tidak teratur, tetapi agak sulit untuk memahami hubungan antara peristiwa pengambilan sampel dan antara sampel dan beberapa variabel target (misalnya respons model). Juga, apakah tujuannya bersifat prediksi atau deskriptif?
Iterator
2
Mengapa seseorang memilih pertanyaan ini? Mengapa tidak mencoba membantu mengembangkan pertanyaan atau jawaban yang lebih baik?
Iterator
2
@Iterator Karena bahkan sekarang, setelah "pengeditan lebih lanjut," tidak ada pertanyaan yang jelas di sini. Downvote (disampaikan setelah tidak ada tanggapan terhadap komentar pertama saya) ditempatkan untuk mendorong OP untuk memberikan perbaikan yang diperlukan, serta sinyal dari satu-satunya keadaan yang terbentuk sebagian dari pertanyaan yang ada. Bukan tugas setiap pembaca (atau mod, dalam hal ini) untuk menebak apa yang dimaksudkan!
whuber

Jawaban:

10

Saya telah menghabiskan cukup banyak waktu membangun kerangka umum untuk rangkaian waktu yang tidak merata: http://www.eckner.com/research.html

Selain itu, saya telah menulis makalah tentang tren dan perkiraan musiman untuk rangkaian waktu yang tidak rata.

Saya harap Anda akan menemukan hasilnya bermanfaat!

Andreas Eckner
sumber
5
Terima kasih! Analisis itu sudah lama sekali dan saya tidak lagi melakukannya, tetapi hal serupa mungkin muncul lagi; dan yang lainnya sering mencari utas ini, sehingga komentar Anda tidak sia-sia.
Peter Flom - Reinstate Monica
Terima kasih atas informasinya (dan memang bertahun-tahun kemudian seseorang di internet mencarinya!), Tetapi tautannya mati.
Ketagihan
2

Saya tidak tahu apakah model campuran sangat tepat (menggunakan paket standar di mana struktur efek acak adalah prediktor linier), kecuali Anda berpikir bahwa data pada semua titik waktu harus dapat saling dipertukarkan dalam beberapa hal (dalam hal ini) interval ireguler adalah bukan masalah) - itu tidak akan benar-benar menjadi model autokorelasi temporal dengan cara yang masuk akal. Mungkin saja Anda bisa menipu Lmer () untuk melakukan semacam hal autogresif tetapi bagaimana tepatnya Anda melakukan hal itu luput dari saya sekarang (saya mungkin tidak berpikir jernih). Juga, saya tidak yakin apa yang akan "variabel pengelompokan" yang menginduksi autokorelasi dalam skenario model campuran.

Jika autokorelasi temporal adalah parameter gangguan dan Anda tidak mengharapkannya jugabesar, maka Anda bisa mengolah data menjadi zaman yang pada dasarnya terpisah satu sama lain dalam hal korelasi (misalnya, pisahkan deret waktu pada titik-titik di mana tidak ada data berbulan-bulan) dan menganggapnya sebagai ulangan independen. Anda kemudian dapat melakukan sesuatu seperti GEE pada set data yang dimodifikasi ini di mana "cluster" didefinisikan oleh zaman Anda berada, dan entri dari matriks korelasi kerja adalah fungsi dari seberapa jauh jarak pengamatan dibuat. Jika fungsi regresi Anda benar, maka Anda masih akan mendapatkan estimasi yang konsisten dari koefisien regresi, bahkan jika struktur korelasi salah ditentukan. Ini juga akan memungkinkan Anda untuk memodelkannya sebagai data penghitungan menggunakan, misalnya, log-link (seperti biasanya dalam regresi poisson). Anda juga dapat membangun beberapa korelasi diferensial antara spesies, di mana setiap titik waktu dipandang sebagai vektor multivariat dari spesies diperhitungkan dengan beberapa hubungan peluruhan sementara di antara titik waktu. Ini akan membutuhkan beberapa pra-pemrosesan untuk mengelabui paket GEE standar untuk melakukan ini.

Jika autokorelasi temporal bukan parameter gangguan, saya akan mencoba sesuatu yang lebih seperti model kovarians terstruktur di mana Anda melihat seluruh dataset sebagai satu pengamatan vektor multivariat besar sehingga kovarians antar pengamatan pada spesies adalah u , vYs,Ytu,v

cov(Ys,Yt)=fθ(s,t,u,v)

di mana adalah beberapa fungsi parametrik yang diketahui hingga sejumlah parameter, , bersama dengan sejumlah parameter untuk mengatur struktur rata-rata. Anda mungkin perlu "membangun sendiri" untuk model seperti ini, tetapi saya juga tidak akan terkejut jika ada paket MPLUS untuk melakukan hal-hal seperti ini untuk data jumlah.θfθ

Makro
sumber
Terima kasih @ Macro. Saya pikir bahwa model campuran mungkin OK karena mereka sering digunakan untuk data yang bersarang dalam waktu; Saya tidak begitu tertarik dalam memodelkan autokorelasi - itu adalah gangguan. Saya setuju waktu tidak akan linier, tapi saya bisa menambahkan efek waktu (belum yakin yang mana, tapi saya bisa menjelajahinya). Saya tidak punya MPLUS, tapi saya punya R dan SAS.
Peter Flom - Reinstate Monica
1
Saya hanya mengatakan bahwa model campuran standar mungkin tidak sesuai dalam situasi ini. Pencegatan acak tidak berguna jika Anda tidak berpikir bahwa poin dapat dipertukarkan dalam hal korelasi (yaitu hanya akan menawarkan perkiraan dalam dunia 'korelasi yang dapat ditukar' dengan struktur korelasi Anda yang sebenarnya). Memasukkan lereng acak dalam waktu menunjukkan Anda berpikir bahwa lintasannya "menuju suatu tempat" seiring waktu - karena plotnya tidak terlalu menyinari Anda, ini mungkin tidak terjadi. Saya akui, Anda mungkin bisa menipu Lmer () agar melakukan sesuatu yang lebih tepat.
Makro
2
+1 Sebuah jawaban yang bagus dan ringkas yang membahas semua poin utama yang saya pikirkan dan lebih banyak lagi. Mengenai paket di R, pencarian Google CRAN, untuk [poisson regression temporal] muncul beberapa paket. The surveillancepaket mungkin memiliki fungsi yang diinginkan. Pemodelan semacam ini tidak biasa dalam studi ekologi, jadi mungkin yang terbaik untuk menemukan paket yang baik di sudut ekologi CRAN.
Iterator