Kami selalu mendengar tentang vektor data ini VS vektor data lain ini independen satu sama lain, atau tidak berkorelasi, dll, dan sementara mudah untuk menemukan matematika mengenai dua konsep itu, saya ingin mengikat mereka menjadi contoh-contoh dari real- hidup, dan juga menemukan cara untuk mengukur hubungan ini.
Dari sudut pandang ini, saya mencari contoh dua sinyal yang merupakan kombinasi berikut: (Saya akan mulai dengan beberapa):
Dua sinyal yang independen DAN (tentu saja) tidak berkorelasi:
- Suara dari mesin mobil (sebut saja ) dan suara Anda ( ) saat Anda berbicara.
- Rekaman kelembaban setiap hari ( ) dan indeks dow-jones ( ).v 2 [ n ]
T1) Bagaimana Anda mengukur / membuktikan bahwa mereka independen dengan dua vektor di tangan? Kita tahu bahwa independensi berarti bahwa produk pdf mereka sama dengan pdf bersama mereka, dan itu hebat, tetapi dengan dua vektor di tangan, bagaimana seseorang membuktikan independensi mereka?
- Dua sinyal yang TIDAK independen, tetapi masih tidak berkorelasi:
T2) Saya tidak bisa memikirkan contoh di sini ... apa contohnya? Saya tahu kita bisa mengukur korelasi dengan mengambil korelasi silang dari dua vektor tersebut, tetapi bagaimana kita membuktikan bahwa mereka juga TIDAK independen?
- Dua sinyal yang berkorelasi:
- Vektor yang mengukur suara penyanyi opera di aula utama, , sementara seseorang merekam suaranya dari suatu tempat di dalam gedung, katakan di ruang latihan ( ).v 2 [ n ]
- Jika Anda terus mengukur detak jantung di mobil Anda, ( ), dan juga mengukur intensitas cahaya biru yang menimpa kaca depan mobil Anda ( ) ... Saya kira itu akan sangat berkorelasi .. . :-)v 2 [ n ]
Q3) Terkait dengan q2, tetapi dalam hal mengukur korelasi silang dari titik berdiri empiris ini, apakah cukup untuk melihat titik produk dari vektor-vektor tersebut (karena itu adalah nilai pada puncak korelasi silang mereka)? Mengapa kita peduli dengan nilai-nilai lain dalam fungsi cross-corr?
Terima kasih sekali lagi, semakin banyak contoh yang diberikan semakin baik untuk membangun intuisi!
sumber
Jawaban:
Beberapa elemen ... (Saya tahu ini tidak lengkap, jawaban yang lebih lengkap mungkin harus menyebutkan momen)
Q1
Untuk memeriksa apakah dua distribusi independen, Anda perlu mengukur seberapa mirip distribusi bersama dengan produk dari distribusi marjinalnya . Untuk tujuan ini, Anda dapat menggunakan jarak antara distribusi. Jika Anda menggunakan divergensi Kullback-Leibler untuk membandingkan distribusi tersebut, Anda akan mempertimbangkan jumlahnya:p ( x ) × p ( y )p ( x , y) p ( x ) × p ( y)
Dan Anda akan mengenali ... Informasi Saling Menguntungkan! Semakin rendah, semakin independen variabel-variabelnya.
Lebih praktisnya, untuk menghitung jumlah ini dari pengamatan Anda, Anda dapat memperkirakan kepadatan , , dari data Anda menggunakan penduga kepadatan Kernel dan melakukan integrasi numerik pada grid halus. ; atau hanya mengukur data Anda ke dalam bin dan menggunakan ekspresi dari Informasi Bersama untuk distribusi diskrit.p ( y ) p ( x , y ) Np ( x ) p ( y) p ( x , y) N
Q2
Dari halaman Wikipedia tentang independensi dan korelasi statistik:
Dengan pengecualian pada contoh terakhir, distribusi 2D ini tidak berkorelasi (matriks kovarians diagonal), tetapi tidak independen, distribusi marginal dan .p ( x ) p ( y )p ( x , y) p ( x ) p ( y)
Q3
Memang ada situasi di mana Anda mungkin melihat semua nilai dari fungsi korelasi silang. Mereka muncul, misalnya, dalam pemrosesan sinyal audio. Pertimbangkan dua mikrofon yang menangkap sumber yang sama, tetapi jauh dari beberapa meter. Korelasi silang dari kedua sinyal akan memiliki puncak kuat pada lag yang sesuai dengan jarak antara mikrofon dibagi dengan kecepatan suara. Jika Anda hanya melihat korelasi silang pada lag 0, Anda tidak akan melihat bahwa satu sinyal adalah versi yang bergeser waktu dari yang lain!
sumber
Menyimpulkan apakah dua sinyal independen sangat sulit dilakukan (diberikan pengamatan terbatas) tanpa pengetahuan / asumsi sebelumnya.
Dua variabel acak dan Y adalah independen jika nilai X tidak memberikan informasi tentang nilai Y (yaitu tidak mempengaruhi distribusi probabilitas kami sebelumnya untuk Y ). Ini sama dengan transformasi nonlinear X dan Y yang tidak berkorelasi yaitu cov ( f 1 ( X ) , f 2 ( Y ) ) = E ( f 1 ( X ) , f 2 ( Y )X Y X Y Y X Y
untuk f 1 dan f 2 non-linierdengan asumsi wlog kedua variabel memiliki rata-rata nol. Perbedaan antara kemandirian dan uncorrelatedness adalah bahwa X dan Y tidak berkorelasi jika di atas berlaku, hanya untuk f 1 ( x ) = f 2 ( x ) = x , fungsi identitas.
Jika kita mengasumsikan Gaussianity bersama, maka semua momen sambungan lebih besar dari urutan 2 sama dengan nol dan dalam hal ini tidak berkorelasi menyiratkan independen. Jika kita tidak memiliki asumsi sebelumnya, maka estimasi momen bersama akan memberi kita informasi tentang 'seberapa tergantung' mereka pada satu sama lain.E( XsayaYj)
Contoh :
sumber