Apakah korelasi = 0,2 berarti ada hubungan “hanya 1 dalam 5 orang”?

48

Dalam Otak Idiot: Seorang Ilmuwan Saraf Menjelaskan Apa yang Sebenarnya Diperhatikan oleh Kepala Anda , tulis Dean Burnett

Korelasi antara tinggi dan kecerdasan biasanya disebut sekitar , yang berarti tinggi dan kecerdasan tampaknya terkait hanya dalam orang.0.215

Bagi saya, ini kedengarannya salah: Saya memahami korelasi lebih seperti (kurangnya) kesalahan yang kita dapatkan ketika kita mencoba memprediksi satu ukuran (di sini kecerdasan) jika satu-satunya hal yang kita ketahui tentang orang itu adalah ukuran lain (di sini tinggi). Jika korelasinya atau , maka kami tidak membuat kesalahan dalam prediksi kami, jika korelasinya adalah , maka ada lebih banyak kesalahan. Dengan demikian korelasi akan berlaku untuk siapa pun satu, bukan hanya di orang.110.815

Saya telah melihat pertanyaan ini tetapi saya tidak cukup baik dalam matematika untuk memahami jawabannya. Jawaban ini yang berbicara tentang kekuatan hubungan linear sepertinya sejalan dengan pemahaman saya tetapi saya tidak yakin.

Sitak
sumber
6
@ JamesPhillips, yang Anda maksud adalah , bukan itu sendiri. Jika maka jadi 4%. r2rr=0.2r2=0.04
Richard Hardy
4
4 persen jauh lebih masuk akal daripada 20 persen, terima kasih atas koreksi, saya setuju dengan Anda.
James Phillips
29
Sampel 0,01% dari buku ini membuat saya bertanya-tanya apa yang dapat ditemukan dalam sisanya ...
Nick Cox
11
Saya menyukai posting ini karena ini adalah jenis pertanyaan yang sangat sederhana yang, ketika ditanya tentang siswa statistik 001 (atau orang baru lainnya, atau pelamar pekerjaan), akan secara instan dan tanpa salah menentukan apakah mereka memahami apa arti korelasi.
whuber
4
Saya akan berhenti membaca buku itu, sekarang
PhD

Jawaban:

69

Kutipan yang dikutip itu memang salah. Koefisien korelasi mengukur tingkat asosiasi di seluruh populasi (atau sampel, dalam kasus koefisien korelasi sampel). Itu tidak membagi populasi menjadi beberapa bagian dengan satu bagian menunjukkan asosiasi dan bagian lainnya tidak. Ini bisa menjadi kasus bahwa populasi sebenarnya terdiri dari dua sub-populasi dengan derajat yang berbeda dari asosiasi, tetapi koefisien korelasi saja tidak berarti ini.

Kodiologis
sumber
19
Terlebih lagi, bahkan dalam populasi di mana 20% orang menunjukkan korelasi sempurna antara tinggi dan kecerdasan dan 80% menunjukkan nol korelasi, korelasi seluruh populasi tidak selalu 0,2. Pernyataan itu salah dalam beberapa hal!
Nuklir Wang
Hal-hal aneh terjadi dengan utas yang masuk ke daftar Hot Network. Jawaban ini jelas benar dan baik-baik saja ... tetapi 57 terbalik? :-)
amoeba berkata Reinstate Monica
2
@amoeba Jika Anda pikir itu liar, periksa jawaban saya dengan skor tertinggi .
Kodiologist
Haha, kamu tuannya!
Amuba kata Reinstate Monica
Apakah itu dianggap trolling ke +1 sesuatu hanya untuk memajukan keanehan yang SE?
Nat
18

Tidak, 0,2 tidak berarti 1 dari 5 orang menunjukkan korelasi. Saya tidak tahu bagaimana dia bisa menulis omong kosong ini.

Inilah sumber angka 0,2: "Pada sumber korelasi tinggi-intelijen: Wawasan baru dari model ACE bivariat dengan perkawinan asortatif", https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ Ternyata, korelasinya kuat.

Saya sudah tahu tentang hal itu: IQ saya naik dengan tinggi ketika saya tumbuh lebih tinggi. Sekarang saya tahu mengapa saya tidak semakin pintar lagi: tinggi badan saya stabil.

Tentu saja, ini adalah lelucon, tetapi menunjukkan masalah dengan argumen penulis buku "Idiot" itu: tidak ada yang mengukur dalam korelasi subjek dengan tinggi dan IQ, setidaknya sejauh yang saya tahu. Saya tidak yakin bagaimana Anda melakukannya dengan bersih, akan ada banyak hal yang membingungkan.

Setelah mengatakan bahwa para peneliti menggunakan trik seperti melihat di dalam kembar dan dalam korelasi keluarga tinggi dan IQ, ini membantu mereka mengatasi masalah yang membingungkan. Agaknya, kembar tumbuh dalam lingkungan yang sama dan memiliki DNA yang sama, sehingga dalam studi observasi membantu untuk mengatasi endogenitas dan masalah lainnya. Namun jika Anda mengesampingkan semua ini, intinya adalah bahwa "korelasi 0,2" tidak memberikan dasar untuk mengatakan omong kosong seperti pada beberapa orang ada korelasi dan pada orang lain tidak ada. Itu hanya interpretasi konyol dari hasil studi korelasi.

Aksakal
sumber
8
-1: sementara saya memahami semangat paragraf terakhir dari jawaban ini, saya percaya bahwa itu meningkatkan kebingungan karena tidak perlu memperkenalkan konsep kausalitas (di whysini tidak relevan).
Jorge Leitao
1
Anda harus menjadi satu dari lima yang memiliki korelasi.
Carsten S
@ JorgeLeitão Tentu saja tidak, tidak ada sebab-akibat yang tersirat, mereka tumbuh bersama, itu korelasional! :)
Firebug
@ JorgeLeitão, jika ada penelitian NN menunjukkan bahwa ukuran itu penting. Baik otak yang lebih besar dan sampel yang lebih besar. Jadi kita ketika kita tumbuh otak kita meningkat dan kita menjalankan lebih banyak hal melalui mereka, karenanya, kita harus menjadi lebih pintar. Selain itu, rata-rata pria lebih tinggi daripada wanita, jadi mereka juga harus lebih pintar.
Aksakal
Hah, sungguh omong kosong.
Lightness Races dengan Monica
8

Ironi dalam pernyataan itu hampir terlalu tebal untuk diurai. Diberi judul teks, saya berasumsi bahwa beberapa lidah dimaksudkan. Namun, "nyali" Anda yang mengatakan bahwa ini salah mungkin berada di jalur yang benar, jika intuisi berarti apa pun. Sayangnya, banyak pelaporan ilmiah lolos dari intuisi ketika berhadapan dengan konsep yang belum kita temui.

Ada kemungkinan bahwa, ketika mengukur hubungan antara dan , korelasi antara dan adalah 1,0 pada 20% populasi, dan 0 pada 80% sisanya. Efek bersihnya adalah bahwa secara keseluruhan korelasi dan adalah 0,2. Kami melihat ini sepanjang waktu dalam pharmacoepidemiology: obat eksperimental dianggap "efektif" jika rata-rata ada manfaat positif; banyak obat dalam sirkulasi umum, beberapa di antaranya dapat Anda pakai, dapat membahayakan Anda karena interaksi dengan perilaku atau genetika Anda, tetapi tidak ada yang benar-benar mengetahui hal ini.Y X Y X YXYXYXY

Di atas hanyalah satu kemungkinan interpretasi dari korelasi 0,2; itu sangat dibuat-buat karena begitu sedikit hal dalam hidup memiliki korelasi antara 1 atau 0, dan lebih sedikit hal masih memiliki efek modifikasi yang cukup kuat untuk menghasilkan korelasi yang berbeda tersebut.

AdamO
sumber
1
"Ada kemungkinan bahwa, ketika mengukur hubungan antara X dan Y, korelasi antara X dan Y adalah 1,0 pada 20% populasi, dan 0 pada 80% sisanya." - dalam penelitian yang saya posting mereka melihat dalam keluarga dan antara korelasi kembar, mereka berbeda dari populasi keseluruhan. Namun, saya yakin bukan itu yang dimaksud penulis buku, melainkan bagaimana ia mengartikan apa korelasi masalahnya
Aksakal
@ Aksakal yang menarik, metode komponen-varians ini dimaksudkan untuk memperkirakan korelasi tingkat populasi yang sama seperti yang akan diukur dalam suatu populasi, mereka hanya mengklaim menggunakan heritabilitas untuk "memangkas" varian fenotipik yang disebabkan oleh pengaruh lingkungan saat ini (komponen E dari ACE model): sumber penting dari perancu dalam hipotesis yang dipertimbangkan.
AdamO
10
Jika korelasi adalah 1 dalam 20% dari populasi dan 0 dalam 80%, itu tidak mengikuti bahwa secara keseluruhan itu adalah 0,2. Tergantung pada varian relatif di setiap sub-populasi.
Amuba kata Reinstate Monica
1
@amoeba ya, poin bagus, lebih jauh menggarisbawahi skenario idiopatik apa yang akan membenarkan klaim semacam itu.
AdamO
4
"Aku berasumsi bahwa beberapa lidah di pipi dimaksudkan." Anda lebih amal daripada saya. Itu benar-benar salah. Saya tidak melihat alasan untuk berpikir bahwa penulis itu sengaja salah dengan cara yang seharusnya pintar. Penafsiran yang paling dermawan adalah bahwa penulis ingin menggarisbawahi sifat probabilistik dari suatu korelasi dan tanpa berpikir memilih cara yang buruk untuk menggambarkannya, suatu cara yang penulis sendiri mungkin akan setuju tidak benar-benar masuk akal jika itu ditunjukkan kepadanya.
John Coleman
2

Akan sulit untuk menghasilkan interpretasi tentang hal ini yang bermakna, apalagi benar. Asosiasi bukan properti dari titik data individual. Jika Anda hanya memiliki tinggi dan kecerdasan satu orang, bagaimana mungkin Anda bisa mengatakan apakah tinggi dan kecerdasan terkait? Saya kira jika kita memiliki rata-rata tinggi dan kecerdasan, kita dapat mengatakan bahwa setiap orang di atas rata-rata di keduanya, atau di bawah rata-rata di keduanya, menunjukkan "asosiasi". Tetapi jika Anda memiliki data yang benar-benar acak (tidak ada korelasi), Anda harus berharap bahwa setengah dari orang-orang menunjukkan "hubungan" dalam pengertian ini. Saya menghasilkan kumpulan data acak dengan korelasi sekitar 0,2 (sebenarnya 0,22), dan menemukan bahwa 55 menunjukkan "hubungan" dalam pengertian ini.

Adalah mungkin bagi Y untuk meningkatkan fungsi X, dan korelasi di antara mereka hanya 0,5; akan konyol untuk mengatakan bahwa hanya setengah dari orang menunjukkan asosiasi jika setiap orang memiliki kecerdasan yang lebih tinggi daripada setiap orang yang lebih pendek dan kecerdasan yang lebih rendah daripada semua orang yang lebih tinggi. Selain itu, secara teori dimungkinkan untuk memiliki satu outlier yang menciptakan semua korelasi, dan korelasi dari himpunan tanpa titik itu menjadi nol. Bahkan mungkin saja memiliki 20% populasi memiliki korelasi negatif, dan 80% lainnya juga memiliki korelasi negatif, dan total korelasi menjadi .2.

Akumulasi
sumber