Perhatikan grafik berikut:
Garis merah (sumbu kiri) menggambarkan volume perdagangan saham tertentu. Garis biru (sumbu kanan) menjelaskan volume pesan twitter untuk stok itu. Misalnya, pada 9 Mei (05-09) sekitar 1.100 juta perdagangan dan 4.000 tweet dibuat.
Saya ingin menghitung apakah ada korelasi antara jangka waktu, baik pada hari yang sama atau dengan jeda - misalnya: volume tweet berkorelasi dengan volume perdagangan satu hari kemudian. Saya membaca banyak artikel yang telah membuat analisis seperti itu, misalnya Mengkorelasikan Finansial Time Series dengan Kegiatan Micro-Blogging , tetapi mereka tidak menjelaskan bagaimana analisis semacam itu dibuat dalam istilah praktis. Berikut ini dinyatakan dalam artikel:
Namun, saya memiliki sedikit pengalaman dengan analisis statistik dan tidak tahu bagaimana menjalankan ini pada seri yang saya miliki. Saya menggunakan SPSS (juga dikenal sebagai PASW) dan pertanyaan saya adalah: apa langkah yang harus diambil untuk membuat analisis dari titik di mana saya memiliki datafile yang mendasari gambar di atas? Apakah pengujian semacam itu merupakan fitur default (dan apa sebutannya) dan / atau bagaimana saya bisa menjalankannya?
Bantuan apa pun akan sangat dihargai :-)
sumber
Jawaban:
Dua pemeriksaan untuk normalitas bivariat periksa tiga hal:
Untuk memeriksa normalitas pada setiap langkah ini, gunakan plot qq normal atau Anda dapat menggunakan tes hipotesis normalitas apa pun.
Atau sebagai alternatif, Anda dapat memeriksa apakah setiap kombinasi linear yang mungkin (koefisien nyata) dari kedua seri tersebut sedikit normal. Tapi itu mungkin akan sulit.
Sunting: (6 tahun kemudian) Saya akan menyimpan di atas untuk anak cucu, tetapi perhatikan saya memiliki jawaban yang lebih baru untuk pertanyaan serupa di sini .
sumber
Koefisien korelasi antara deret waktu tidak berguna. Lihat KOEFISIEN KORELASI - Nilai kritis untuk Signifikansi Pengujian . Ini pertama kali ditunjukkan oleh U. Yule pada tahun 1926 Yule, GU, 1926, "Mengapa kita kadang-kadang mendapatkan korelasi omong kosong antara deret waktu? Sebuah studi dalam pengambilan sampel dan sifat deret waktu", Journal of Royal Statistics Society 89, 1 –64 . Anda mungkin ingin google "mengapa kita mendapatkan korelasi omong kosong" untuk lebih.
Alasan untuk ini adalah tes untuk korelasi normalitas sendi membalas. Normalitas sendi mengharuskan setiap seri menjadi normal. Normalitas membutuhkan kemandirian. Untuk menguji hubungan antara deret waktu, harap tinjau Identifikasi Fungsi Transfer dalam buku deret waktu yang bagus seperti Analisis Deret Waktu: Metode Univariat dan Multivariat, oleh William WS Wei, David P. Reilly .
Jawaban Tantangan
Dalam hal jawaban atas tantangan Anda. Diketahui, oleh beberapa ( Yule, GU, 1926 ) bahwa korelasi dua deret waktu dapat cacat khususnya jika salah satu deret dipengaruhi oleh pulsa / perubahan level / pulsa musiman dan / atau tren waktu lokal. Karena itu saya akan mengambil setiap seri SEPARATELY dan mengidentifikasi struktur ARIMA dan setiap pulsa / perubahan level / pulsa musiman dan / atau tren waktu lokal yang mungkin berlaku dan membuat proses kesalahan.
Dengan dua proses kesalahan bersih, satu untuk masing-masing dari dua seri asli, saya akan menghitung korelasi silang yang kemudian dapat digunakan untuk mengukur tingkat asosiasi di atas dan di luar struktur auto-korelatif dalam setiap seri. Solusi ini tepat disebut pendekatan pra-pemutihan ganda.
Lihat:
sumber