Saya tahu secara empiris itulah masalahnya. Saya baru saja mengembangkan model yang mengalami teka-teki ini. Saya juga curiga itu belum tentu jawaban ya / tidak. Maksud saya jika kedua A dan B berkorelasi dengan C, ini mungkin memiliki beberapa implikasi mengenai korelasi antara A dan B. Tapi, implikasi ini mungkin lemah. Ini mungkin hanya tanda arah dan tidak ada yang lain.
Inilah yang saya maksud ... Katakanlah A dan B keduanya memiliki korelasi 0,5 dengan C. Karena itu, korelasi antara A dan B bisa jadi 1,0. Saya pikir itu juga bisa 0,5 atau bahkan lebih rendah. Tapi, saya pikir itu tidak mungkin negatif. Apakah kamu setuju dengan itu?
Juga, apakah ada implikasi jika Anda mempertimbangkan Koefisien Korelasi Pearson standar atau sebaliknya Koefisien Korelasi Spearman (pangkat)? Pengamatan empiris saya baru-baru ini dikaitkan dengan Koefisien Korelasi Spearman.
Jawaban:
Karena korelasi adalah properti matematika dari distribusi multivariat, beberapa wawasan dapat murni diperoleh melalui perhitungan, terlepas dari asal statistik dari distribusi tersebut.
Untuk korelasi Pearson , mempertimbangkan variabel multinormal , Y , Z . Ini berguna untuk dikerjakan karena setiap matriks pasti non-negatif sebenarnya adalah matriks kovarians dari beberapa distribusi multinormal, dengan demikian menyelesaikan pertanyaan keberadaan. Jika kita berpegang pada matriks dengan 1 pada diagonal, entri off-diagonal dari matriks kovarians akan menjadi korelasinya. Menulis korelasi X dan Y sebagai ρ , korelasi Y dan Z sebagai τ , dan korelasi X dan Z sebagaiX Y Z 1 X Y ρ Y Z τ X Z , kami menghitungnya,σ
(karena ini adalah penentu matriks korelasi dan tidak boleh negatif).1+2ρστ−(ρ2+σ2+τ2) ≥0
Ketika ini menyiratkan bahwa ρ 2 + τ 2 ≤ 1 . Dengan kata lain: ketika ρ dan τ besarnya besar, X dan Z harus memiliki korelasi nol.σ= 0 ρ2+τ2≤ 1 ρ τ X Z
Jika , maka setiap nilai non-negatif σ (antara 0 dan 1 tentu saja) adalah mungkin.ρ2=τ2= 1 / 2 σ 0 1
Ketika , nilai negatif σ diijinkan. Misalnya, ketika ρ = τ = 1 / 2 , σ bisa dimana saja antara - 1 / 2 dan 1 .ρ2+τ2< 1 σ ρ = τ= 1 / 2 σ - 1 / 2 1
Pertimbangan ini menyiratkan memang ada beberapa kendala pada korelasi timbal balik. Kendala (yang hanya bergantung pada kepastian non-negatif dari matriks korelasi, bukan pada distribusi variabel yang sebenarnya) dapat diperketat tergantung pada asumsi tentang distribusi univariat. Misalnya, mudah untuk melihat (dan membuktikan) bahwa ketika distribusi dan Y tidak berada dalam keluarga skala lokasi yang sama, korelasinya harus benar - benar berukuran kurang dari 1 . (Bukti: korelasi ± 1 menyiratkan X dan Y secara linear terkait sebagai)X Y 1 ± 1 X Y
Sejauh korelasi peringkat Spearman berjalan, pertimbangkan tiga pengamatan trivariat , ( 2 , 3 , 1 ) , dan ( 3 , 2 , 3 ) dari ( X , Y , Z ) . Mereka saling rank korelasi adalah 1 / 2 , 1 / 2 , dan - 1 / 2 . Dengan demikian bahkan tanda korelasi peringkat( 1 , 1 , 2 ) ( 2 , 3 , 1 ) ( 3 , 2 , 3 ) ( X, Y, Z) 1 / 2 1 / 2 - 1 / 2 dan Z dapat menjadi kebalikan dari tanda-tanda korelasi dari X dan Y dan X dan Z .Y Z X Y X Z
sumber
Saya sedang dalam perjalanan memancing tahunan sekarang. Ada korelasi antara waktu hari saya ikan dan jumlah ikan yang saya tangkap. Ada juga korelasi antara ukuran umpan yang saya gunakan dan jumlah ikan yang saya tangkap. Tidak ada korelasi antara ukuran umpan dan waktu dalam sehari.
sumber
Korelasi adalah kosinus sudut antara dua vektor. Dalam situasi yang dijelaskan, (A, B, C) adalah tiga kali pengamatan, dibuat n kali, setiap pengamatan menjadi bilangan real. Korelasi antara A dan B adalah kosinus sudut antara dan V B = B - E ( B ) yang diukur dalam ruang euclidean n-dimensi. Jadi situasi kita berkurang dengan mempertimbangkan 3 vektor V A , V B dan V CVA=A−E(A) VB=B−E(B) VA VB VC dalam ruang n dimensi. Kami memiliki 3 pasang vektor dan karenanya 3 sudut. Jika dua sudutnya kecil (korelasi tinggi) maka yang ketiga juga akan kecil. Tetapi untuk mengatakan "berkorelasi" tidak banyak pembatasan: itu berarti bahwa sudutnya antara 0 dan . Secara umum ini tidak memberikan batasan sama sekali pada sudut ketiga. Dengan kata lain, mulailah dengan sudut kurang dari π antara V A dan V B (korelasi apa pun kecuali -1). Mari V C membagi dua sudut antara V A dan V B . Kemudian C akan dikorelasikan dengan A dan B.π/2 π VA VB VC VA VB
sumber
Sebagai tambahan untuk jawaban whuber: Formula yang disajikan
.1 + 2 ρ στ- ( ρ2+ σ2+ τ2) ≥0
dapat diubah menjadi ketidaksetaraan berikut (Olkin, 1981):
Sebuah representasi grafis dari batas atas dan bawah untuk terlihat seperti:ρ
Olkin, I. (1981). Batasan rentang untuk matriks korelasi momen-produk. Psychometrika, 46, 469-472. doi: 10.1007 / BF02293804
sumber
Saya pikir lebih baik untuk bertanya "mengapa mereka HARUS berkorelasi?" atau, mungkin "Mengapa harus ada korelasi khusus?"
Kode R berikut menunjukkan kasus di mana x1 dan x2 keduanya berkorelasi dengan Y, tetapi memiliki 0 korelasi satu sama lain
Korelasi dengan Y dapat dibuat lebih kuat dengan mengurangi 0,3 menjadi 0,1 atau apa pun
sumber
Saya akan menyerahkan demonstrasi statistik kepada mereka yang lebih cocok daripada saya untuk itu ... tetapi secara intuitif mengatakan bahwa peristiwa A menghasilkan proses X yang berkontribusi pada pembuatan acara C. Kemudian A berkorelasi dengan C (melalui X). B, di sisi lain menghasilkan Y, yang juga membentuk C. Oleh karena itu A berkorelasi dengan C, B berkorelasi dengan C tetapi A dan B tidak berkorelasi.
sumber
Bagi mereka yang menginginkan intuisi, korelasi dapat dilihat sebagai kosinus dari beberapa sudut. Jadi, pertimbangkan tiga vektor dalam 3D, misalkan A, B, dan C, masing-masing sesuai dengan satu variabel. Pertanyaannya adalah untuk menentukan rentang sudut yang mungkin antara A dan C ketika sudut antara A dan B serta sudut antara B et C diketahui. Untuk itu, Anda dapat bermain dengan alat online tanpa menginstal perangkat lunak apa pun. Cukup buka halaman http://www.montefiore.ulg.ac.be/~pierard/chained_correlations.php
sumber
Mari kita ambil satu contoh:
Untuk beberapa x, A dan B akan memiliki korelasi yang signifikan, demikian pula A dan C juga akan memiliki korelasi yang signifikan tetapi korelasi B dan C tidak akan signifikan.
Jadi, itu tidak selalu benar bahwa jika A dan B berkorelasi dan A dan C berkorelasi maka B dan C juga berkorelasi.
Catatan: Untuk pemahaman mendalam, Silakan pikirkan contoh ini pada data besar.
sumber