Menentukan rangkaian waktu berkorelasi terbaik

8

Sebelum bertanya, saya membaca pertanyaan serupa, tetapi tidak ada yang mengarah ke jawaban yang memuaskan untuk minat khusus saya.

Saya ingin menyeragamkan serangkaian waktu iklim dari presipitasi Republik Dominika selama 64 tahun (1940-2003). Untuk itu, sangat penting untuk memilih seri referensi di antara sekelompok kandidat.

Katakanlah sjoadalah seri dasar, yang ingin saya temukan seri referensi yang bagus; bani, plcdan ramerupakan kandidat referensi, karena mereka dekat sjo. Dalam peta berikut, titik merah adalah stasiun pangkalan, dan yang hijau adalah kandidat referensi:

Saya melakukan tiga analisis korelasi (dilakukan dalam R, fungsi cor()), dengan mempertimbangkan variabel-variabel bulanan ini: nilai curah hujan mentah, perbedaan normal, dan nilai-nilai yang ditransformasikan dengan Box-Cox. Variabel-variabel tersebut masing-masing sesuai dengan bidang yang dimulai dengan p, diandan pnorm.

Perbedaan yang dinormalisasi berasal dari metode seri perbedaan pertama (FDM), yang diusulkan oleh Peterson, yang terdiri dari: , di mana adalah nilai curah hujan untuk bulan , dan adalah presipitasi untuk bulan yang sama 1 tahun sebelumnya. Saya mengikuti komentar Peterson dan rekan (1998) , yang mengatakan bahwa FDM yang diterapkan pada presipitasi mungkin bekerja lebih baik menggunakan perbedaan yang dinormalisasi.[PmtPmt1]/[Pmt+Pmt1]PmtmPmt1

Seperti dapat dilihat di halaman 1 file PDF ini , korelasi dihitung untuk seluruh seri waktu (1940-2003). Untuk curah hujan mentah dan nilai transformasi Box-Cox, baniadalah yang terbaik berkorelasi dengan sjo(sel latar belakang kuning menunjukkan indeks korelasi maksimum). Perhatikan bahwa untuk curah hujan mentah, banisecara signifikan lebih berkorelasi daripada yang lain. Untuk perbedaan yang dinormalisasi, rahanya sedikit lebih berkorelasi daripada yang lain. Namun, setiap stasiun kandidat memiliki indeks korelasi yang signifikan secara statistik dengan sjopada tingkat signifikansi , menunjukkan APAPUN dari mereka dapat digunakan sebagai seri referensi.α=.05

Ini agak membingungkan, jadi saya tidak puas dan memutuskan untuk membuat analisis yang lebih rinci, memisahkan seri dalam interval periode 5 tahun, dan mengevaluasi korelasi antara seri untuk 3 variabel yang sama: curah hujan mentah, perbedaan normalisasi dan Box-Cox ditransformasikan .

Tabel dari halaman 2 hingga 8 dalam PDF menunjukkan hasil korelasi parsial ini; halaman terakhir merangkum waktu setiap stasiun memiliki nilai korelasi maksimum untuk setiap variabel. Seperti dapat dilihat, baniadalah nilai yang paling sering berkorelasi untuk 3 variabel yang dianalisis (dalam semua kasus, lebih dari 7 kali dari dua belas periode 5 tahun yang dianalisis).

Dengan hasil ini, saya pikir itu baniadalah kandidat terbaik sebagai seri referensi sjo, tapi saya tidak yakin tentang itu. Apakah analisis periode lima tahun baik-baik saja? Haruskah saya melakukan beberapa analisis lain?

JoseRamon
sumber
Terima kasih @Nick untuk koreksi, saya belajar banyak dari mereka. Maaf, bahasa Inggris bukan bahasa ibu saya.
JoseRamon
Senang bisa membantu :) Pekerjaan Anda sudah lebih jelas daripada banyak penutur asli! Perubahan saya hanya kosmetik dan teknis, tidak penting. Selamat Datang di CV BTW!
Nick Stauner
korelasinya signifikan, tetapi apakah perbedaan antara korelasi ini berbeda? jika tidak, maka Anda tidak dapat memilih satu stasiun referensi di atas yang lain berdasarkan korelasi
Aksakal
Terima kasih @Aksakal atas komentar Anda. Untuk seluruh periode yang dianalisis, dan khusus untuk curah hujan mentah, 'sjo' (seri dasar) memiliki indeks korelasi ini dengan kandidat referensi: 0,650 dengan 'bani', 0,536 dengan 'plc', dan 0,557 dengan 'ra'. Apakah indeks terbesar secara signifikan lebih besar daripada yang berikutnya lebih berkorelasi? Mengenai variabel lain, perbedaan dinormalisasi dan Box-Cox ditransformasikan, perbedaannya tidak besar. Haruskah saya menerapkan analisis lain? Apa yang akan Anda sarankan kepada saya?
JoseRamon
@ JoseRamon, saya tidak bisa menjawab pertanyaan ini, Anda memiliki datanya. Anda dapat menjalankan tes statistik untuk melihat apakah perbedaannya signifikan
Aksakal

Jawaban:

1

bagaimana kalau Anda mencoba Two-Way Anova AND tes berpasangan apakah dengan data tahunan Anda dan / atau interval periode 5 tahun. Anda juga dapat melakukan ini dengan data mentah, normalisasi data atau data Box-Cox.

Gagasannya adalah, Anda dapat mencari perbedaan yang tidak signifikan (untuk stasiun referensi) antara distribusi curah hujan per stasiun.

Saya menemukan tautan ini sangat membantu untuk memulai Two-Way-Anova Anda sendiri melalui R r-tutorial-series-two-way-anova

Sebastian

tester1234
sumber
Terima kasih Sebastian atas jawaban Anda. Saya akan mencoba saran ini, yang tampaknya sangat membantu. Saya sudah menggunakannya dalam penelitian lain, dan sangat kuat.
JoseRamon
Halo lagi @ tester1234. Saya mencoba melakukan tes Anova Dua Arah untuk data saya. Berdasarkan tautan yang Anda sarankan kepada saya: manakah yang harus menjadi dua faktor saya? Bolehkah saya mengatakan: variabel mana yang harus saya masukkan ke dalam fungsi 'lm ()'? Saya memiliki curah hujan dari 3 stasiun (pbani, pplc, pra), dan saya ingin tahu mana yang paling berkorelasi dengan stasiun keempat (psjo). Saya memiliki data bulanan yang dikelompokkan dalam interval periode 5 tahun (data dapat diunduh dari tautan ini ). Terima kasih sebelumnya
JoseRamon