Pertama-tama, saya tidak menanyakan ini:
Mengapa nol korelasi tidak menyiratkan independensi?
Ini ditujukan (agak baik) di sini: /math/444408/why-does-zero-correlation-not-imply-independence
Yang saya tanyakan adalah kebalikannya ... katakanlah dua variabel sepenuhnya independen satu sama lain.
Tidak bisakah mereka memiliki sedikit korelasi secara kebetulan?
Bukankah seharusnya ... independensi menyiratkan korelasi SANGAT KECIL?
correlation
mathematical-statistics
covariance
independence
Joshua Ronis
sumber
sumber
Jawaban:
Dengan definisi koefisien korelasi, jika dua variabel independen, korelasinya adalah nol. Jadi, tidak mungkin ada korelasi secara kebetulan!
JikaX dan Y adalah independen, berarti E[XY]=E[X]E[Y] . Oleh karena itu, pembilang ρX,Y adalah nol dalam kasus ini.
Jadi, jika Anda tidak mengubah arti korelasi, seperti yang disebutkan di sini, itu tidak mungkin. Kecuali, jelaskan definisi Anda tentang apa korelasinya.
sumber
Tidak ada yang istimewa tentang distribusi eksponensial dalam hal ini. Mengubah distribusi induk ke standar normal memberikan hasil sebagai berikut.
sumber
Jawaban sederhana: jika 2 variabel independen, maka korelasi populasi adalah nol, sedangkan korelasi sampel biasanya kecil, tetapi tidak nol.
Itu karena sampel bukan representasi yang sempurna dari populasi.
Semakin besar sampel, semakin baik mewakili populasi, sehingga semakin kecil korelasinya. Untuk sampel tanpa batas , korelasinya akan menjadi nol.
sumber
Mungkin ini bermanfaat bagi sebagian orang yang berbagi pemahaman intuitif yang sama. Kita semua pernah melihat sesuatu seperti ini:
Seperti yang telah ditunjukkan orang lain, nilai sampel berkorelasi, tetapi itu tidak berarti populasi memiliki korelasi nol.
Tentu saja, keduanya harus independen — mengingat Nicolas Cage muncul dalam 10 film pengaturan rekor tahun ini, kita tidak boleh menutup kolam renang lokal untuk musim panas untuk tujuan keamanan.
Tetapi ketika kami memeriksa berapa banyak orang yang tenggelam tahun ini, ada kemungkinan kecil bahwa 1000 orang yang tenggelam dalam rekor tahun ini tenggelam.
Tidak mungkin mendapatkan korelasi seperti itu. Mungkin satu dari seribu. Tapi itu mungkin, meskipun keduanya independen. Tapi ini hanya satu kasus. Pertimbangkan bahwa ada jutaan peristiwa yang mungkin untuk diukur di sana, dan Anda dapat melihat peluang bahwa peluang dua orang untuk memberikan korelasi tinggi cukup tinggi (karenanya keberadaan grafik seperti itu di atas).
Cara lain untuk melihatnya adalah bahwa menjamin bahwa dua peristiwa independen akan selalu memberikan nilai yang tidak berkorelasi dengan sendirinya membatasi. Diberikan dua dadu independen, dan hasil yang pertama, ada serangkaian hasil (yang cukup besar) untuk dadu kedua yang akan memberikan beberapa korelasi nol. Membatasi hasil dadu kedua untuk memberikan korelasi nol dengan yang pertama adalah pelanggaran yang jelas terhadap independensi, karena gulungan dadu pertama sekarang memengaruhi distribusi hasil.
sumber