Saya menemukan penjelasan berikut di blog dan saya ingin mendapatkan informasi lebih lanjut tentang non-transitivitas korelasi:
Kami memiliki fakta tak terbantahkan berikut:
- Rata-rata, ada perbedaan volume otak antara pria dan wanita
- Ada korelasi antara IQ dan ukuran otak; korelasinya adalah 0,33 dan dengan demikian sesuai dengan 10% dari variabilitas IQ
Dari premis 1 dan 2 ini, tampaknya secara logis mengikuti hal itu: rata-rata wanita memiliki IQ lebih rendah daripada pria. Tapi itu adalah kesalahan! Dalam statistik, korelasi tidak transitif. Buktinya adalah Anda hanya perlu melihat hasil tes IQ, dan mereka menunjukkan bahwa IQ pria dan wanita rata-rata tidak berbeda.
Saya ingin memahami korelasi non-transitivitas ini sedikit lebih dalam.
Jika korelasi antara IQ dan ukuran otak adalah 0,9 (yang saya tahu bukan (1)), akankah menyimpulkan bahwa perempuan rata-rata memiliki IQ lebih rendah daripada laki-laki masih akan keliru?
Tolong, saya di sini bukan untuk berbicara tentang IQ (dan batas-batas tes), seksisme, stereotip wanita, kesombongan, dan sebagainya (2). Saya hanya ingin memahami alasan logis di balik kesalahan tersebut.
(1) yang saya tahu bukan: Neanderthal memiliki otak yang lebih besar daripada homo sapiens, tetapi tidak lebih pintar;
(2) Saya seorang wanita dan secara keseluruhan, saya tidak menganggap diri saya, atau wanita lain kurang pintar daripada pria, saya tidak peduli dengan tes IQ, karena yang dihitung adalah nilai orang, dan itu tidak berdasarkan pada kemampuan intelektual.
Sumber asli dalam bahasa Prancis:
Pada les faits indiscutables suivan:
- Anda juga dapat melihat perbedaan volume pada moyenne entre hommes et femmes
- il ya une entrelation qI et volume cérébral; la corrélation est 0,33 dan sesuai donc à 10% de la variabilité
De presmisses 1 et 2, il semble découler logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.
Mais c'est une erreur de raisonnement! En statistique, les corrélations ne sont pas transitives. La preuve, c'est que pour en avoir le cœur net, il suffit de accepter les rultultats des tests de QI, dan ceux-ci montrent que les QI des hommes dan des femmes ne diffèrent pas en moyenne.
Jawaban:
Ya, itu masih salah.
Berikut adalah gambar yang sangat sederhana yang menunjukkan empat situasi berbeda. Dalam setiap kasus titik-titik merah mewakili wanita, titik biru mewakili pria, sumbu horizontal mewakili ukuran otak dan sumbu vertikal mewakili IQ. Saya menghasilkan keempat set data sehingga:
selalu ada perbedaan yang sama dalam ukuran otak rata-rata antara pria ( ) dan wanita ( 28 - unit berubah-ubah). Ini adalah rata-rata populasi, tetapi perbedaan ini cukup besar untuk signifikan secara statistik dengan ukuran sampel yang masuk akal;22 28
selalu ada nol perbedaan dalam IQ rata-rata antara pria dan wanita (keduanya ), dan juga nol korelasi antara gender dan IQ;100
kekuatan korelasi antara ukuran otak dan IQ bervariasi seperti yang ditunjukkan pada gambar.
Di subplot kiri atas korelasi gender (dihitung secara terpisah atas pria dan terpisah atas wanita, kemudian dirata-ratakan) adalah , seperti dalam kutipan Anda. Di subplot kanan atas korelasi keseluruhan (lebih dari pria dan wanita bersama-sama) adalah 0,3 . Perhatikan bahwa kutipan Anda tidak menentukan apa yang mengacu pada angka 0,33 . Di subplot kiri bawah korelasi gender adalah 0,9 , seperti pada contoh hipotetis Anda; dalam korelasi keseluruhan subplot kanan bawah adalah 0,9 .0.3 0.3 0.33 0.9 0.9
Jadi Anda dapat memiliki nilai korelasi apa pun, dan tidak masalah apakah itu dihitung secara keseluruhan atau di dalam grup. Apa pun koefisien korelasinya, sangat mungkin bahwa tidak ada korelasi antara gender dan IQ dan nol perbedaan gender dalam IQ rata-rata.
Menjelajahi non-transitivitas
Mari kita menjelajahi ruang penuh kemungkinan, mengikuti pendekatan yang disarankan oleh @kjetil. Misalkan Anda memiliki tiga variabel dan (tanpa kehilangan sifat umum) misalkan korelasi antara x 1 dan x 2 adalah a > 0 dan korelasi antara x 2 dan x 3x1,x2,x3 x1 x2 a>0 x2 x3 adalah . Pertanyaannya adalah: berapa nilai positif minimal yang mungkin dari korelasi λ antara x 1 dan x 3b>0 λ x1 x3 ? Apakah terkadang harus positif, atau bisakah selalu nol?
Matriks korelasi adalah dan harus memiliki determinan non-negatif, yaitu d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) ≥ 0 , yang berarti bahwa λ harus terletak antara sebuah b ± √
Kita dapat menyelesaikan ini secara numerik dan memplot nilai minimal positif minimal untuk a dan b yang berbeda :λ a b
Secara informal, kita dapat mengatakan bahwa korelasi akan menjadi transitif jika diberikan bahwa dan b > 0 , orang dapat menyimpulkan bahwa λ > 0 . Kita melihat bahwa untuk sebagian besar nilai a dan b , λ dapat menjadi nol, yang berarti bahwa korelasi adalah non-transitif. Namun, untuk beberapa nilai yang cukup tinggia>0 b>0 λ>0 a b λ dan b yang, korelasi λ harus positif, yang berarti bahwa ada "beberapa derajat transitivitas" setelah semua, tetapi terbatas pada korelasi yang sangat tinggi saja. Perhatikan bahwa kedua korelasi a dan ba b λ a b harus tinggi.
Kita bisa bekerja di luar kondisi yang tepat untuk ini "transitivitas": seperti yang disebutkan di atas, akar yang lebih kecil harus positif, yaitu , yang setara dengan sebuah 2 + b 2 > 1 . Ini adalah persamaan lingkaran! Dan memang, jika Anda melihat gambar di atas, Anda akan melihat bahwa wilayah biru membentuk seperempat lingkaran.ab−(1−a2)(1−b2)−−−−−−−−−−−−−√>0 a2+b2>1
Dalam contoh spesifik Anda, korelasi antara jenis kelamin dan ukuran otak cukup moderat (mungkin ) dan korelasi antara ukuran otak dan IQ adalah b = 0,33 , yang kuat dalam wilayah biru (a=0.5 b=0.33 ) yang berarti bahwa λ dapat positif, negatif, atau nol.a2+b2<1 λ
Sosok yang relevan dari studi asli
Anda ingin menghindari diskusi tentang gender dan otak, tetapi saya tidak bisa tidak menunjukkan bahwa melihat gambar lengkap dari artikel asli ( Gur et al. 1999 ), orang dapat melihat bahwa sementara tidak ada perbedaan gender dalam skor IQ verbal, ada perbedaan yang jelas dan signifikan dalam skor IQ spasial! Bandingkan subplot D dan F.
sumber
Memperbarui:
sumber
Ini adalah situasi di mana saya suka menggunakan diagram jalur untuk menggambarkan efek langsung dan efek tidak langsung , dan bagaimana keduanya berdampak pada keseluruhan korelasi.
Per deskripsi asli kami memiliki matriks korelasi di bawah ini. Ukuran otak memiliki sekitar 0,3 korelasi dengan IQ, perempuan dan IQ memiliki korelasi 0 satu sama lain. Saya mengisi korelasi negatif antara ukuran perempuan dan otak menjadi -0,3 (jika saya harus menebak itu jauh lebih kecil dari itu, tetapi ini akan berfungsi untuk tujuan ilustrasi).
Jika kita cocok dengan model regresi di mana IQ adalah fungsi dari ukuran otak dan menjadi perempuan kita dapat menggambarkan ini dalam hal diagram jalur. Saya telah mengisi koefisien regresi parsial pada panah, dan simpul B singkatan dari ukuran otak dan simpul F singkatan untuk perempuan.
Sekarang betapa gila itu - ketika mengendalikan ukuran otak, mengingat korelasi ini, perempuan memiliki hubungan positif dengan IQ. Mengapa demikian, ketika korelasi marjinal adalah nol? Per aturan dengan diagram jalur linier ( Wright, 1934 ), kita dapat menguraikan korelasi marjinal sebagai fungsi dari efek langsung ketika mengendalikan ukuran otak dan efek tidak langsung:
In this notationTotalF,IQ=Cor(F,IQ) . So per the original definition we know this total effect to be zero. So now we just need to figure out the direct effect and the indirect effect. The indirect effect in this diagram is simply following the other arrow from females to IQ through brain size, which is the correlation of females and brain size multiplied by the partial correlation of brain size and IQ.
Because the total effect is zero, we know that the direct effect must simply be the exact opposite sign and size of the indirect effect, hence the direct effect equals 0.099 in this example. Now, here we have a situation when assessing the expected IQ of females we get two different answers, although probably not what you initially expected when specifying the question. When simply assessing the marginal expected IQ of females versus males, the difference is zero as you defined it (by having a zero correlation). When assessing the expected difference conditional on brain size, females have a larger IQ than males.
You can insert into this example either larger correlations between brain size and IQ (or smaller correlations between female and brain size), given the limits kjetil shows in his answer. Increasing the former makes the disparity between the conditional IQ of women and men even greater in favor of women, decreasing the latter makes the differences smaller.
sumber
To provide the purely abstract mathematical answer, denotev the brain volume and q the IQ index. Use 1 to index men and 2 to index women. Let's assume that the following are facts:
Note that while the quoted text talks about "correlation between brain volume and IQ" in general, the supplied image makes a distinction with the two trend-lines (i.e. it shows the correlation for the two subgroups separately). So we consider them separately (which is the correct way to go).
Then
and
Does the above obtained inequalities necessitateE(q1)>E(q2) ??
To check this assume on the contrary thatE(q1)=E(q2)=q¯(4)
Then it must be the case that
and that
Well, it certainly can be the case, that inequalities(5) and (6) hold at the same time, and so "equal IQ on average" is perfectly compatible with the initial assumptions that we took as facts.(1) .
In fact it could very well happen that we could have a higher average IQ from women than for men, for the same set of facts in
In other words, the correlation assumptions/facts in(1) do not impose any constraint whatsoever about the relation between average IQ's at all. All possible relation between E(q1) and E(q2) may hold, and be compatible with the assumptions in (1) .
sumber