Adakah yang bisa menggambarkan bagaimana bisa ada ketergantungan dan nol kovarian?

12

Adakah yang bisa mengilustrasikan, seperti yang dilakukan Greg, tetapi secara lebih rinci, bagaimana variabel acak dapat bergantung, tetapi tidak memiliki kovarian nol? Greg, poster di sini, memberi contoh menggunakan lingkaran di sini .

Adakah yang bisa menjelaskan proses ini secara lebih rinci menggunakan urutan langkah-langkah yang menggambarkan proses pada beberapa tahap?

Juga, jika Anda mengetahui contoh dari psikologi, harap ilustrasikan dengan konsep ini dengan contoh terkait. Harap sangat tepat dan berurutan dalam penjelasan Anda, dan sebutkan juga apa akibatnya.

pengguna11883
sumber
Tautan ke artikel yang Anda rujuk akan membantu.
gui11aume
1
Saya cukup yakin topiknya ada di sini: stats.stackexchange.com/questions/12842/… dan jawabannya oleh Greg (Snow) ada di sini: stats.stackexchange.com/a/12898/2073
Andy McKenzie
Awalnya saya pikir menutup pertanyaan ini benar tetapi saya pikir mungkin ia mengajukan pertanyaan yang agak berbeda dari di sini stats.stackexchange.com/questions/12842/... karena utas itu hanya meminta contoh matematika, sementara pertanyaan ini tampaknya mencari pemahaman yang persis mengapa keduanya tidak setara
Makro

Jawaban:

21

Ide dasar di sini adalah bahwa kovarians hanya mengukur satu jenis ketergantungan tertentu , oleh karena itu keduanya tidak setara. Secara khusus,

  • Kovarian adalah ukuran seberapa linier terkait dua variabel. Jika dua variabel terkait non-linear, ini tidak akan tercermin dalam kovarians. Deskripsi yang lebih terperinci dapat ditemukan di sini .

  • Ketergantungan antara variabel acak mengacu pada segala jenis hubungan antara keduanya yang menyebabkan mereka bertindak berbeda "bersama" daripada mereka "sendiri". Secara khusus, ketergantungan antara variabel acak menggolongkan hubungan antara keduanya yang menyebabkan distribusi bersama mereka tidak menjadi produk dari distribusi marginal mereka. Ini termasuk hubungan linear serta banyak lainnya.

  • Jika dua variabel terkait non-linear , maka mereka berpotensi dapat memiliki 0 kovarians tetapi masih tergantung - banyak contoh diberikan di sini dan plot di bawah ini dari wikipedia memberikan beberapa contoh grafis di baris bawah:

    masukkan deskripsi gambar di sini

  • Salah satu contoh di mana nol kovarians dan independensi antara variabel acak adalah kondisi yang setara adalah ketika variabel terdistribusi normal bersama (yaitu, dua variabel mengikuti distribusi normal bivariat , yang tidak setara dengan dua variabel yang didistribusikan secara individual). Kasus khusus lain adalah bahwa pasangan variabel bernoulli tidak berkorelasi jika dan hanya jika mereka independen (terima kasih @ cardinal). Tapi, secara umum keduanya tidak bisa dianggap setara.

Oleh karena itu, secara umum, seseorang tidak dapat menyimpulkan bahwa dua variabel independen hanya karena mereka tampaknya tidak berkorelasi (misalnya tidak gagal untuk menolak hipotesis nol tanpa korelasi). Seseorang disarankan untuk memplot data untuk menyimpulkan apakah keduanya terkait, tidak hanya berhenti pada uji korelasi. Misalnya, (terima kasih @gung), jika seseorang menjalankan regresi linier (yaitu pengujian untuk korelasi tidak nol) dan menemukan hasil yang tidak signifikan, orang mungkin tergoda untuk menyimpulkan bahwa variabel tidak terkait, tetapi Anda Saya hanya menyelidiki hubungan linear .

Saya tidak tahu banyak tentang Psikologi tetapi masuk akal bahwa mungkin ada hubungan non-linear antara variabel di sana. Sebagai contoh mainan, tampaknya mungkin bahwa kemampuan kognitif tidak berhubungan linear dengan usia - orang yang sangat muda dan sangat tua tidak setajam usia 30 tahun. Jika seseorang merencanakan beberapa ukuran kemampuan kognitif vs usia seseorang dapat berharap untuk melihat bahwa kemampuan kognitif tertinggi pada usia sedang dan meluruh di sekitar itu, yang akan menjadi pola non-linear.

Makro
sumber
1
Hanya catatan sisi ( pedantic ?! ), tetapi variabel acak Bernoulli bersifat independen jika dan hanya jika tidak berkorelasi. :)
kardinal
@ cardinal, jangan khawatir itu hanya saya meninggalkan rasionalitas lagi, seperti ketika Anda mengatakan bahwa multivarian normal dengan matriks kovarians singular adalah "umum digunakan dan relevan secara statistik".
Makro
Lain kali saya di Ann Arbor, saya akan membelikan Anda kopi untuk mencoba mengimbangi lelucon itu. :) Jangan ragu untuk mempertanyakan rasionalitas saya. :)
kardinal
Ah, tapi kutipan terakhir itu benar . ;-) Itu muncul di beberapa tempat yang sangat umum. :) (Meskipun itu sedikit di luar topik di sini.)
kardinal
(+1) Saya agak khawatir tentang apakah pertanyaan ini harus ditutup sebagai duplikat atau tidak. Tapi, saya pikir jawaban yang baik dapat membuat pertanyaan yang sangat mirip layak dijaga. Memiliki semua tautan silang membantu.
kardinal
7

Cara standar untuk mengajar / memvisualisasikan korelasi atau kovarian adalah dengan memplot data, menggambar garis pada rata-rata 'x' dan 'y', kemudian menggambar persegi panjang dari titik 2 berarti ke titik-titik data individual, seperti ini:

masukkan deskripsi gambar di sini

Persegi panjang (titik) di kuadran kanan atas dan kiri bawah (merah dalam contoh) berkontribusi nilai positif untuk korelasi / kovarian, sedangkan persegi panjang (titik) di kuadran kiri atas dan kanan bawah (biru pada contoh) berkontribusi negatif nilai-nilai untuk korelasi / kovarian. Jika total area dari persegi panjang merah sama dengan total area dari persegi panjang biru maka positif dan negatif membatalkan dan Anda mendapatkan nol kovarians. Jika ada lebih banyak area di merah maka kovarians akan positif dan jika ada lebih banyak area di biru maka kovarians akan negatif.

Sekarang mari kita lihat contoh dari diskusi sebelumnya:

masukkan deskripsi gambar di sini

Poin individu mengikuti parabola, sehingga mereka tergantung, jika Anda tahu 'x' maka Anda tahu 'y' persis, tetapi Anda juga dapat melihat bahwa untuk setiap kotak merah ada kotak biru yang cocok, sehingga kovarians akhir akan 0 .

Greg Snow
sumber
(+1) apakah ada Rpaket yang membuat plot ini (saya ingat whuber menampilkan plot seperti ini sekali) atau apakah Anda melakukan ini dari awal?
Makro
@ Macro, pertanyaan yang bagus, meskipun saya pikir whuber dilakukan di Mathematica. Sangat mudah untuk melakukan ini "dengan tangan" di R menggunakan polygonatau rectdan perangkat yang mendukung transparansi alpha.
kardinal
Saya menulis fungsi untuk melakukan plot ini dan mungkin akan menambahkannya ke TeachingDemospaket dalam waktu dekat. Pikiran pertama saya adalah mempersingkat frasa "segi empat korelasi" menjadi "mengoreksi" sebagai nama fungsi, kemudian setelah sedikit menyadari bahwa nama dapat dengan mudah disalahpahami sebagai melakukan sesuatu yang sangat berbeda. Jadi saya perlu membuat nama yang lebih baik, menambahkan beberapa opsi dan mengunggahnya ke R-Forge.
Greg Snow
3

Satu tes sederhana jika itu jika data pada dasarnya mengikuti pola yang simetris di sekitar sumbu vertikal atau horizontal melalui rata-rata, co-variance akan mendekati nol. Misalnya, jika simetri berada di sekitar sumbu y, itu berarti bahwa untuk setiap nilai dengan y yang diberikan, ada perbedaan x positif dari rata-rata x dan perbedaan negatif dari rata-rata x. Penambahan y * x untuk nilai-nilai tersebut akan menjadi nol. Anda dapat melihat ini diilustrasikan dengan baik dalam kumpulan contoh plot di jawaban lain. Ada pola-pola lain yang akan menghasilkan co-variance nol tetapi tidak independen, tetapi banyak contoh mudah dievaluasi dengan mencari simetri atau tidak.

David B
sumber
1

Contoh dari Wikipedia :

"Jika variabel independen, koefisien korelasi Pearson adalah 0, tetapi sebaliknya tidak benar karena koefisien korelasi hanya mendeteksi dependensi linear antara dua variabel. Misalnya, misalkan variabel acak X terdistribusi secara simetris sekitar nol, dan Y = X ^ 2. Kemudian Y sepenuhnya ditentukan oleh X, sehingga X dan Y sangat tergantung, tetapi korelasinya nol; tidak berkorelasi. Namun, dalam kasus khusus ketika X dan Y bersama-sama normal, ketidakcocokan sama dengan independensi. "

accssharma
sumber