Non-transitivitas korelasi: korelasi antara jenis kelamin dan ukuran otak dan antara ukuran otak dan IQ, tetapi tidak ada korelasi antara jenis kelamin dan IQ

18

Saya menemukan penjelasan berikut di blog dan saya ingin mendapatkan informasi lebih lanjut tentang non-transitivitas korelasi:

Kami memiliki fakta tak terbantahkan berikut:

  • Rata-rata, ada perbedaan volume otak antara pria dan wanita
  • Ada korelasi antara IQ dan ukuran otak; korelasinya adalah 0,33 dan dengan demikian sesuai dengan 10% dari variabilitas IQ

Dari premis 1 dan 2 ini, tampaknya secara logis mengikuti hal itu: rata-rata wanita memiliki IQ lebih rendah daripada pria. Tapi itu adalah kesalahan! Dalam statistik, korelasi tidak transitif. Buktinya adalah Anda hanya perlu melihat hasil tes IQ, dan mereka menunjukkan bahwa IQ pria dan wanita rata-rata tidak berbeda.

Saya ingin memahami korelasi non-transitivitas ini sedikit lebih dalam.

Jika korelasi antara IQ dan ukuran otak adalah 0,9 (yang saya tahu bukan (1)), akankah menyimpulkan bahwa perempuan rata-rata memiliki IQ lebih rendah daripada laki-laki masih akan keliru?

Tolong, saya di sini bukan untuk berbicara tentang IQ (dan batas-batas tes), seksisme, stereotip wanita, kesombongan, dan sebagainya (2). Saya hanya ingin memahami alasan logis di balik kesalahan tersebut.


(1) yang saya tahu bukan: Neanderthal memiliki otak yang lebih besar daripada homo sapiens, tetapi tidak lebih pintar;

(2) Saya seorang wanita dan secara keseluruhan, saya tidak menganggap diri saya, atau wanita lain kurang pintar daripada pria, saya tidak peduli dengan tes IQ, karena yang dihitung adalah nilai orang, dan itu tidak berdasarkan pada kemampuan intelektual.


Sumber asli dalam bahasa Prancis:

Pada les faits indiscutables suivan:

  • Anda juga dapat melihat perbedaan volume pada moyenne entre hommes et femmes
  • il ya une entrelation qI et volume cérébral; la corrélation est 0,33 dan sesuai donc à 10% de la variabilité

De presmisses 1 et 2, il semble découler logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.

Mais c'est une erreur de raisonnement! En statistique, les corrélations ne sont pas transitives. La preuve, c'est que pour en avoir le cœur net, il suffit de accepter les rultultats des tests de QI, dan ceux-ci montrent que les QI des hommes dan des femmes ne diffèrent pas en moyenne.

masukkan deskripsi gambar di sini

MagTun
sumber
5
Saya tidak mengerti bagaimana pernyataan ini ada hubungannya dengan korelasi sama sekali (dan merujuk pada "transitivitas" tampaknya sepenuhnya tidak sesuai dalam konteks ini). Kesimpulannya, bagaimanapun, ada hubungannya dengan perbedaan rata - rata. Statistik itu (yang merupakan momen pertama) sama sekali independen dari korelasi (yang berasal dari momen kedua). Bahkan ketika korelasinya sempurna orang tidak dapat menarik kesimpulan apa pun tentang perbedaan rata-rata dari variabel kedua berdasarkan pada perbedaan rata-rata dari variabel pertama. ±1
whuber
5
Seseorang dapat menunjukkan (Langford, Schwertman, dan Owens (2001)) bahwa korelasi positif adalah transitif jika jumlah korelasi kuadrat lebih besar dari 1: ρXY2+ρYX2>1ρXZ>0
CloseToC
2
@whuber: Ya, tapi ini bukan pertanyaan tentang hubungan antara rata-rata X dan Y (ukuran otak dan IQ), itu adalah pertanyaan tentang hubungan antara rata-rata Y dalam dua kelompok yang berbeda ... Saya pikir ini jelas bahwa jika korelasi antara ukuran otak dan IQ sempurna (yaitu IQ adalah fungsi linier dari ukuran otak) dan jika ukuran otak rata-rata berbeda antara pria dan wanita, maka IQ rata-rata berbeda antara pria dan wanita.
Amuba mengatakan Reinstate Monica
2
@Amoeba Terima kasih atas interpretasi itu. Kutipan mulai masuk akal (akhirnya!). Tetapi untuk menyebut ini sebagai "transitivitas korelasi" sangat tidak jelas sehingga terus terang menyesatkan. (Ungkapannya ada dalam bahasa Prancis asli, jadi kita bahkan tidak bisa menyalahkan terjemahannya.)
whuber
3
@amoeba Itu masuk akal. Tapi saya pikir Anda harus meregangkan segalanya untuk sampai di sana! Kutipan ini tidak mencirikan hubungan antara jenis kelamin dan ukuran otak sebagai "korelasi" - hanya sebagai perbedaan dalam cara antara kedua kelompok (yang bukan merupakan ukuran standar korelasi, secara kebetulan). Tapi saya kira kita seharusnya memahami "korelasi" dalam arti luas sebagai "kurangnya ketergantungan" atau sesuatu seperti itu.
whuber

Jawaban:

16

Ya, itu masih salah.

Berikut adalah gambar yang sangat sederhana yang menunjukkan empat situasi berbeda. Dalam setiap kasus titik-titik merah mewakili wanita, titik biru mewakili pria, sumbu horizontal mewakili ukuran otak dan sumbu vertikal mewakili IQ. Saya menghasilkan keempat set data sehingga:

  • selalu ada perbedaan yang sama dalam ukuran otak rata-rata antara pria ( ) dan wanita ( 28 - unit berubah-ubah). Ini adalah rata-rata populasi, tetapi perbedaan ini cukup besar untuk signifikan secara statistik dengan ukuran sampel yang masuk akal;2228

  • selalu ada nol perbedaan dalam IQ rata-rata antara pria dan wanita (keduanya ), dan juga nol korelasi antara gender dan IQ;100

  • kekuatan korelasi antara ukuran otak dan IQ bervariasi seperti yang ditunjukkan pada gambar.

correlations

Di subplot kiri atas korelasi gender (dihitung secara terpisah atas pria dan terpisah atas wanita, kemudian dirata-ratakan) adalah , seperti dalam kutipan Anda. Di subplot kanan atas korelasi keseluruhan (lebih dari pria dan wanita bersama-sama) adalah 0,3 . Perhatikan bahwa kutipan Anda tidak menentukan apa yang mengacu pada angka 0,33 . Di subplot kiri bawah korelasi gender adalah 0,9 , seperti pada contoh hipotetis Anda; dalam korelasi keseluruhan subplot kanan bawah adalah 0,9 .0.30.30.330.90.9

Jadi Anda dapat memiliki nilai korelasi apa pun, dan tidak masalah apakah itu dihitung secara keseluruhan atau di dalam grup. Apa pun koefisien korelasinya, sangat mungkin bahwa tidak ada korelasi antara gender dan IQ dan nol perbedaan gender dalam IQ rata-rata.


Menjelajahi non-transitivitas

Mari kita menjelajahi ruang penuh kemungkinan, mengikuti pendekatan yang disarankan oleh @kjetil. Misalkan Anda memiliki tiga variabel dan (tanpa kehilangan sifat umum) misalkan korelasi antara x 1 dan x 2 adalah a > 0 dan korelasi antara x 2 dan x 3x1,x2,x3x1x2a>0x2x3 adalah . Pertanyaannya adalah: berapa nilai positif minimal yang mungkin dari korelasi λ antara x 1 dan x 3b>0λx1x3? Apakah terkadang harus positif, atau bisakah selalu nol?

Matriks korelasi adalah dan harus memiliki determinan non-negatif, yaitu d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) 0 , yang berarti bahwa λ harus terletak antara sebuah b ±

R=(1aλa1bλb1)
detR=λ2+2abλ(a2+b21)0,
λJika kedua akar positif, maka nilai minimal yang mungkin dariλsama dengan akar yang lebih kecil (danλharus positif!). Jika nol di antara kedua akar ini, makaλ
ab±(1a2)(1b2).
λλλ dapat menjadi nol.

Kita dapat menyelesaikan ini secara numerik dan memplot nilai minimal positif minimal untuk a dan b yang berbeda :λab

Exploring non-transitivity

Secara informal, kita dapat mengatakan bahwa korelasi akan menjadi transitif jika diberikan bahwa dan b > 0 , orang dapat menyimpulkan bahwa λ > 0 . Kita melihat bahwa untuk sebagian besar nilai a dan b , λ dapat menjadi nol, yang berarti bahwa korelasi adalah non-transitif. Namun, untuk beberapa nilai yang cukup tinggia>0b>0λ>0abλ dan b yang, korelasi λ harus positif, yang berarti bahwa ada "beberapa derajat transitivitas" setelah semua, tetapi terbatas pada korelasi yang sangat tinggi saja. Perhatikan bahwa kedua korelasi a dan babλ ab harus tinggi.

Kita bisa bekerja di luar kondisi yang tepat untuk ini "transitivitas": seperti yang disebutkan di atas, akar yang lebih kecil harus positif, yaitu , yang setara dengan sebuah 2 + b 2 > 1 . Ini adalah persamaan lingkaran! Dan memang, jika Anda melihat gambar di atas, Anda akan melihat bahwa wilayah biru membentuk seperempat lingkaran.ab(1a2)(1b2)>0a2+b2>1

Dalam contoh spesifik Anda, korelasi antara jenis kelamin dan ukuran otak cukup moderat (mungkin ) dan korelasi antara ukuran otak dan IQ adalah b = 0,33 , yang kuat dalam wilayah biru (a=0.5b=0.33 ) yang berarti bahwa λ dapat positif, negatif, atau nol.a2+b2<1λ


Sosok yang relevan dari studi asli

Anda ingin menghindari diskusi tentang gender dan otak, tetapi saya tidak bisa tidak menunjukkan bahwa melihat gambar lengkap dari artikel asli ( Gur et al. 1999 ), orang dapat melihat bahwa sementara tidak ada perbedaan gender dalam skor IQ verbal, ada perbedaan yang jelas dan signifikan dalam skor IQ spasial! Bandingkan subplot D dan F.

Gur et al.

amuba kata Reinstate Monica
sumber
2
Saya suka plot yang Anda hasilkan. Yang dari koran, tidak begitu banyak ...
shadowtalker
1
@AlexandrBlekh: Sejujurnya, saya tidak yakin. "Peta panas"? "Contour plot" tetapi diwarnai dan tanpa kontur?
Amuba kata Reinstate Monica
2
|λ|λ
1
xyyzxzab0λ0
amoeba berkata Reinstate Monica
1
Terima kasih amoeba untuk jawaban yang panjang dan membosankan ini (dan bahkan menambahkan ekstra, sangat disambut dengan cara)! Itu membuat semuanya jelas! Konsepnya sangat sulit untuk dipecahkan untuk otak saya yang secara statistik tidak terlatih dan Anda menaungi masalah itu! Terima kasih banyak atas waktu yang Anda berikan untuk mengirim jawaban Anda!
MagTun
8

x1=IQ,x2=genderx3

cor(x1,x2)=λ,cor(x1,x3)=cor(x2,x3)=ρ=0.9
λ
R=(1λρλ1ρρρ1)
ρ
detR=1(1ρ2)λ(λρ2)+ρ(λρρ)=1λ22ρ2+2λρ20,
ρ2λ+12ρ=0.9λ0.62

Memperbarui:

p=0.5μ1=E(x1|x2=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20 informasi tentang IQ perbedaan rata-rata salah! Itu akan benar jika jenis kelamin adalah variabel kontinu, yang jelas tidak. Perhatikan bahwa fakta ini terkait dengan fakta bahwa untuk distribusi binomial, varians adalah fungsi dari rata-rata (sebagaimana mestinya, karena hanya ada satu parameter bebas yang bervariasi). Apa yang telah kami lakukan di atas benar-benar memperluas ini ke kovarians / korelasi.

ρ=0.33λ0.7822λ=0

kjetil b halvorsen
sumber
1
Dan bagaimana cHair(x1,x2)0,62 membantu kita untuk menyimpulkan (meskipun keliru) E(x1)E(x2)? Apakah saya melewatkan sesuatu yang mendasar di sini?
Khashaa
5
+1 - Tapi saya menemukan konsep korelasi antara mens dan womens IQ agak membingungkan, karena Anda tidak pernah bisa menghitung nilai seperti itu.
Andy W
1
Apa hubungan antara IQ pria dan wanita seharusnya artinya ?!
Amuba kata Reinstate Monica
ya, itu benar @amoeba! Saya mungkin tidak menggunakan kata-kata yang tepat untuk mengungkapkan kebingungan saya (sulit karena saya tidak terbiasa dengan statistik) tetapi variabelnya memang jenis kelamin, IQ, dan ukuran otak.
MagTun
7

Ini adalah situasi di mana saya suka menggunakan diagram jalur untuk menggambarkan efek langsung dan efek tidak langsung , dan bagaimana keduanya berdampak pada keseluruhan korelasi.

Per deskripsi asli kami memiliki matriks korelasi di bawah ini. Ukuran otak memiliki sekitar 0,3 korelasi dengan IQ, perempuan dan IQ memiliki korelasi 0 satu sama lain. Saya mengisi korelasi negatif antara ukuran perempuan dan otak menjadi -0,3 (jika saya harus menebak itu jauh lebih kecil dari itu, tetapi ini akan berfungsi untuk tujuan ilustrasi).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

Jika kita cocok dengan model regresi di mana IQ adalah fungsi dari ukuran otak dan menjadi perempuan kita dapat menggambarkan ini dalam hal diagram jalur. Saya telah mengisi koefisien regresi parsial pada panah, dan simpul B singkatan dari ukuran otak dan simpul F singkatan untuk perempuan.

enter image description here

Sekarang betapa gila itu - ketika mengendalikan ukuran otak, mengingat korelasi ini, perempuan memiliki hubungan positif dengan IQ. Mengapa demikian, ketika korelasi marjinal adalah nol? Per aturan dengan diagram jalur linier ( Wright, 1934 ), kita dapat menguraikan korelasi marjinal sebagai fungsi dari efek langsung ketika mengendalikan ukuran otak dan efek tidak langsung:

TotalF,IQ=LangsungF,IQ+Tidak langsungF,B,IQ

In this notation TotalF,IQ=Cor(F,IQ). So per the original definition we know this total effect to be zero. So now we just need to figure out the direct effect and the indirect effect. The indirect effect in this diagram is simply following the other arrow from females to IQ through brain size, which is the correlation of females and brain size multiplied by the partial correlation of brain size and IQ.

IndirectF,B,IQ=Cor(F,B)Cor(B,IQ|F)0.099=0.30.33

Because the total effect is zero, we know that the direct effect must simply be the exact opposite sign and size of the indirect effect, hence the direct effect equals 0.099 in this example. Now, here we have a situation when assessing the expected IQ of females we get two different answers, although probably not what you initially expected when specifying the question. When simply assessing the marginal expected IQ of females versus males, the difference is zero as you defined it (by having a zero correlation). When assessing the expected difference conditional on brain size, females have a larger IQ than males.

You can insert into this example either larger correlations between brain size and IQ (or smaller correlations between female and brain size), given the limits kjetil shows in his answer. Increasing the former makes the disparity between the conditional IQ of women and men even greater in favor of women, decreasing the latter makes the differences smaller.

Andy W
sumber
If you look at the picture provided, it shows a positive (and stronger than men's) correlation of women's brain volume with IQ.
Alecos Papadopoulos
1
@Andy W I'm totally ashamed to ask this silly question, but what software did you use to draw the nodes graph?
mugen
1
It was a quick job in inkscape @mugen. Taking more time I think the ones I make using Latex and Tikz are nicer.
Andy W
+1 Could you point me to theory behind your second formula?
Aleksandr Blekh
2
@AleksandrBlekh - the Wright paper I cite is the seminal source. Judea Pearl goes into more more extensive commentary in his Causality book, although there are simpler treatments. (For linear models the decompositions are often given cursory treatment in structural equation modelling books.)
Andy W
3

To provide the purely abstract mathematical answer, denote v the brain volume and q the IQ index. Use 1 to index men and 2 to index women. Let's assume that the following are facts:

(1)E(v1)>E(v2)=βE(v1),0<β<1,ρ(v1,q1)>0,ρ(v2,q2)>0

Note that while the quoted text talks about "correlation between brain volume and IQ" in general, the supplied image makes a distinction with the two trend-lines (i.e. it shows the correlation for the two subgroups separately). So we consider them separately (which is the correct way to go).

Then

ρ(v1,q1)>0Cov(v1,q1)>0E(v1q1)>E(v1)E(q1)

(2)E(v1q1)E(q1)>E(v1)

and

ρ(v2,q2)>0Cov(v2,q2)>0E(v2q2)>E(v2)E(q2)

(3)E(v2q2)βE(q2)>E(v1)

Does the above obtained inequalities necessitate E(q1)>E(q2)??

To check this assume on the contrary that (4)E(q1)=E(q2)=q¯

Then it must be the case that

(5)(2),(4)E(v1q1)q¯>E(v1)

and that

(6)(3),(4)E(v2q2)βq¯>E(v1)

Well, it certainly can be the case, that inequalities (5) and (6) hold at the same time, and so "equal IQ on average" is perfectly compatible with the initial assumptions that we took as facts.
In fact it could very well happen that we could have a higher average IQ from women than for men, for the same set of facts in (1).

In other words, the correlation assumptions/facts in (1) do not impose any constraint whatsoever about the relation between average IQ's at all. All possible relation between E(q1) and E(q2) may hold, and be compatible with the assumptions in (1).

Alecos Papadopoulos
sumber
2
Despite all the calculations shown here, I still do not see how correlation reveals anything at all (or imposes any constraints whatsoever) concerning relationships between mean values.
whuber
@whuber The whole answer is about showing that it doesn't. The last sentences say exactly that. Let's add one more to that effect.
Alecos Papadopoulos
But this is absolutely basic: one doesn't need an entire page of equations to show it! It suffices to observe that correlation coefficients are location-invariant, QED. Am I misinterpreting the question?
whuber
1
@whuber With all due respect and no offense meant to anyone, but I fear that you are "misinterpreting" the knowledge level of the OP. Otherwise, the question would not have been posted.
Alecos Papadopoulos
4
I would encourage you, then, to reflect on whether and how any reply that relies heavily on mathematical equations is appropriate for addressing posters who appear to be asking for elementary expositions of basic concepts. This is a subtle issue because sometimes that is exactly the right approach. Furthermore, the degree to which one uses mathematics--and how one expounds the mathematical ideas--can be a matter of taste. But IMHO this kind of reply is effective only when the mathematics is clear and consistently focused on an essential idea.
whuber