Saya ingin saran tentang metode analisis yang saya gunakan, untuk mengetahui apakah itu baik secara statistik.
Saya telah mengukur dua titik proses dan T 2 = t 2 1 , t 2 2 , . . . , t 2 m dan saya ingin menentukan apakah peristiwa di T 1 entah bagaimana berkorelasi dengan peristiwa di T 2 .
Salah satu metode yang telah saya temukan dalam literatur adalah bahwa membangun histogram lintas-korelasi: untuk setiap kami menemukan penundaan untuk semua peristiwa T 2 yang jatuh dalam jendela waktu tertentu (sebelum dan sesudah t 1 n ), dan kemudian kita membuat histogram dari semua penundaan ini.
Jika dua proses tidak berkorelasi saya harapkan histogram datar, seperti kemungkinan memiliki sebuah acara di setelah (atau sebelum) sebuah acara di T 1 adalah sama sekali penundaan. Di sisi lain jika ada puncak dalam histogram, ini menunjukkan bahwa proses dua titik entah bagaimana saling mempengaruhi (atau, setidaknya, memiliki beberapa input yang sama).
Sekarang, ini bagus dan bagus, tetapi bagaimana saya menentukan apakah histogram memang memiliki puncak (saya harus mengatakan bahwa untuk set data tertentu saya jelas datar, tetapi tetap menyenangkan jika memiliki cara statistik untuk mengkonfirmasikan itu)?
Jadi, di sini apa yang telah saya lakukan: Saya sudah mengulangi proses menghasilkan histogram untuk beberapa (1000) kali menjaga seperti itu dan menggunakan "dikocok" versi T 2 . Untuk mengocok T 2 saya menghitung interval antara semua peristiwa, mengocoknya dan menjumlahkannya untuk menyusun kembali proses titik baru. Di RI cukup lakukan ini dengan:
times2.swp <- cumsum(sample(diff(times2)))
Saya kemudian akan mengambil nilai 95% ini untuk semua penundaan waktu dan menggunakannya sebagai "batas kepercayaan" (mungkin ini bukan istilah yang benar) sehingga apa pun yang melampaui batas ini dalam histogram asli dapat dianggap sebagai "benar" puncak".
Pertanyaan 1 : apakah metode ini benar secara statistik? Jika tidak, bagaimana Anda mengatasi masalah ini?
Pertanyaan 2 : Hal lain yang ingin saya lihat adalah apakah ada jenis korelasi "yang lebih panjang" dari data saya. Misalnya mungkin ada perubahan serupa dalam laju peristiwa dalam dua proses titik (perhatikan bahwa mereka mungkin memiliki tingkat yang sangat berbeda), tapi saya tidak yakin bagaimana cara melakukannya. Saya berpikir untuk membuat "amplop" dari setiap titik proses menggunakan semacam kernel smoothing dan kemudian melakukan analisis korelasi silang dari dua amplop. Bisakah Anda menyarankan jenis analisis lain yang mungkin?
Terima kasih dan maaf atas pertanyaan yang sangat panjang ini.