Apakah tidak ada korelasi yang menyiratkan tidak ada hubungan sebab akibat?

73

Saya tahu bahwa korelasi tidak menyiratkan kausalitas tetapi apakah tidak adanya korelasi menyiratkan tidak adanya kausalitas?

pengguna2088176
sumber
46
Mengutip Andrew Gelman, "Korelasi bahkan tidak menyiratkan korelasi."
Mike Hunter 16
9
Tidak. A bisa menjadi penyebab B, tetapi hanya mempengaruhinya secara nonlinier.
Neil G
3
"Korelasi berkorelasi dengan sebab-akibat. (Hanya tidak terlalu banyak.)"
Adrian
7
Silakan lihat halaman ini untuk alat kontrasepsi. Jika kausalitas tidak menyiratkan korelasi, maka tidak ada korelasi tidak menyiratkan tidak ada kausalitas.
EdM
4
Meskipun ini awal yang baik untuk menandai bahwa korelasi tidak menyiratkan sebab-akibat, dan kemudian membahas detail, saya sudah lama berpikir mengapa memilih korelasi? Saya menaruhnya di assonance, dan ide menarik bagi guru (saya juga) bahwa siswa dengan usaha dapat mengingat slogan dan menggunakannya dalam pemikiran mereka. Tapi kebenarannya, tidak banyak dalam statistik menyiratkan sebab-akibat. Jika tidak dimasukkan, peringatan ini sering datang di bab korelasi atau kuliah korelasi, tetapi itu ada di mana-mana.
Nick Cox

Jawaban:

76

apakah tidak adanya korelasi menyiratkan tidak adanya hubungan sebab akibat?

Tidak. Setiap sistem yang dikendalikan adalah contoh tandingan.

Tanpa hubungan sebab akibat, kontrol jelas tidak mungkin, tetapi kontrol yang berhasil berarti - secara kasar - bahwa kuantitas dijaga konstan, yang menyiratkannya tidak akan berkorelasi dengan apa pun, termasuk hal-hal apa pun yang menyebabkannya konstan.

Jadi dalam situasi ini, menyimpulkan tidak ada hubungan sebab akibat dari kurangnya korelasi akan menjadi kesalahan.

Inilah contoh yang agak topikal .

conjugateprior
sumber
Cara intuitif untuk memikirkannya
Repmat
+1, take yang menarik. Namun, tampaknya menyiratkan bahwa sebab-akibat dapat hadir sementara korelasi dalam bentuk apa pun tidak ada. Itu tidak benar. Jika beberapa peristiwa menyebabkan yang lain akan ada semacam "korelasi hadir, tht _constant yang Anda sebutkan akan dalam bentuk korelasi nonlinier
Aksakal
1
+1 Bra vo! Ketika saya melihat judul pertanyaan di bilah samping, saya semua "Ini perlu menjawab dari perspektif sistem." Kamu berhasil.
Alexis
Jika dari ketiadaan korelasi seseorang menghilangkan kausalitas akankah fungsi yang tersisa menjadi kandidat untuk melabeli "kasualitas"?
ttnphns
1
Tidak yakin saya memahami pertanyaan @ttnphns, tapi saya pikir jawabannya adalah: jika Anda memasang kabel rem (atau melepaskan pedal akselerator) maka bukit memang akan mulai menunjukkan dampak sebab akibat pada kecepatan mobil.
conjugateprior
30

Tidak. Terutama karena dengan korelasi Anda kemungkinan besar berarti korelasi linier . Dua variabel dapat dikorelasikan secara nonlinier , dan mungkin tidak menunjukkan korelasi linier . Mudah untuk membuat contoh seperti itu, tetapi saya akan memberikan contoh yang lebih dekat dengan pertanyaan Anda (lebih sempit).

xf(x)=x2y=f(x)

masukkan deskripsi gambar di sini

Gambar korelasi nonlinier yang bagus dan jelas , tetapi dalam kasus ini juga merupakan hubungan sebab akibat langsung. Namun, koefisien korelasi linier tidak signifikan, yaitu tidak ada korelasi linear meskipun korelasi nonlinier jelas, dan bahkan hubungan sebab akibat:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

x

E[x]=0
E[x2]=1
E[xx2]=E[x3]=0
Cov[x,x2]=E[xx2]E[x]E[x2]=0

U[1,1]

Aksakal
sumber
8
Non-signifikansi tidak menyiratkan kebenaran hipotesis nol. Yang penting dalam contoh Anda adalah bahwa koefisien korelasi populasi adalah 0.
Kodiologist
1
Mengapa Anda percaya OP berarti korelasi linier?
user253751
@immibis, karena sebab akibat harus menghasilkan semacam korelasi nonlinear.
Aksakal
E[X3]E[X2]E[X]XE[X3]E[X2]E[X]X
x
18

Tidak ada . Secara khusus, variabel acak dapat bergantung tetapi tidak berkorelasi.

x[1,1]YxxxYX[1,1]Yx=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

XY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]E[X]E[Y]σXσY=000σXσY=0.
Kodiologis
sumber
1
Sebenarnya, ini adalah contoh buruk menurut saya. X tidak menyebabkan Y. Variabel biner yang tidak ada dalam model PresenceOfX adalah penyebab aktual dengan korelasi 1. Apa yang Anda buktikan sebenarnya bahwa nilai X tidak memengaruhi Y.
user2088176
6
Saya benar-benar bingung untuk bagaimana Anda bisa merasakan bahwa pilihan tidak menyebabkan . Mungkin Anda harus menentukan apa yang Anda maksud dengan "sebab". xY
Kodiologist
5
@ user2088176 Berikut adalah bukti cepat bahwa pilihan menyebabkan . Mari kita menggunakan model counterfactual sebab-akibat, di mana adalah indeks ke satu set kemungkinan distribusi untuk . Jika , maka adalah atau dengan probabilitas yang sama. Jika , maka adalah atau dengan probabilitas yang sama. Karena counterfactual dibedakan dengan nilai menyiratkan distribusi yang berbeda untuk , pilihan menyebabkanxYxYx=12Y1212x=34Y3434xYxY .
Kodiologist
1
Contoh ini mungkin akan lebih sederhana (dan masih berfungsi) jika kita membatasi ke . x[0,1]
JiK
3
Bagaimana dengan contoh sederhana dan standar: dan . Mereka tidak berkorelasi tetapi -distributed adalah sempurna tergantung pada . XN(0,1)X2χ2(1)X2X
Therkel
14

Mungkin melihatnya dari perspektif komputasi akan membantu.

Sebagai contoh konkret, ambil generator nomor pseudorandom.

Apakah ada hubungan sebab akibat antara seed yang Anda atur dan output dari generator?kth

Apakah ada korelasi yang terukur?

Szabolcs
sumber
7

Jawaban yang lebih baik untuk pertanyaan ini adalah bahwa korelasi adalah hubungan statistik, matematika, dan / atau fisik sedangkan kausasi adalah hubungan metafisik. Anda tidak bisa LOGICALLY dari korelasi (atau non-korelasi) ke sebab-akibat, tanpa satu set (besar) asumsi yang mengikat metafisika dengan fisika. (Salah satu contohnya adalah bahwa apa yang mungkin disetujui dua orang untuk menjadi "pengamat yang rasional" sebagian besar sewenang-wenang dan mungkin ambigu). Jika A membayar B untuk melakukan C yang menghasilkan D, apa penyebab D? Tidak ada alasan rasional untuk memilih C atau B atau A (atau salah satu dari peristiwa pendahuluan A). Teori kontrol berkaitan dengan sistem dalam dunia di mana mereka berada di bawah kendali. Salah satu cara untuk mengendalikan variabel dependen adalah dengan mengurangi respons variabel tersebut terhadap kemungkinan variasi (terkontrol) variabel independen terhadap noise statistik. Sebagai contoh, kita tahu tekanan udara berkorelasi dengan kesehatan (coba bernapas dengan vakum), tetapi jika kita mengontrol tekanan udara hingga 1 +/- 0,001 atm, seberapa besarkah variasi tekanan udara yang mempengaruhi kesehatan?

Li Zhi
sumber
Perbedaan yang Anda cari adalah 'diamati dalam sampel' (korelasi) vs ketergantungan yang ada terlepas dari apakah itu diamati dalam sampel (fisika). Tidak ada peran metafisika dalam penjelasan ini (meskipun beberapa untuk asumsi fisik). Mata air memiliki batas elastis terlepas dari apakah mereka pernah mencapainya atau tidak. Atau dalam contoh yang lebih sederhana: kubus gula larut - konsep yang jelas menyiratkan, kira-kira, bahwa jika Anda menjatuhkannya dalam teh itu akan larut. Tetapi sifat kausal ini murni karena struktur fisiknya . Gula batu akan larut bahkan jika kita tidak pernah berpikir untuk melarutkannya.
conjugateprior
1
Anda benar, tentu saja, bahwa tanpa asumsi kausal menjadi argumen, Anda tidak mendapatkan kesimpulan kausal darinya. Tetapi benar-benar tidak ada yang sangat metafisik tentang itu!
conjugateprior
Bagaimana teori kausalitas kontrafaktual (mis. Pearl atau Woodward) secara tepat dirancang untuk memahami "Jika A membayar B untuk melakukan C yang menghasilkan D, apa penyebab D? Tidak ada alasan rasional untuk memilih C atau B atau A" . Satu-satunya gagasan kuno dan gagasan tidak membantu bahwa teori-teori ini dikuburkan adalah bahwa kita selalu dapat membuat sene dari gagasan bahwa ada yang penyebab sesuatu. Tentu saja tidak ada.
conjugateprior
5

Ya , bertentangan dengan balasan sebelumnya. Saya akan menganggap pertanyaan ini sebagai non-teknis, khususnya definisi "korelasi". Mungkin saya menggunakannya terlalu luas, tetapi lihat peluru kedua saya. Saya berharap akan dianggap pantas untuk membahas jawaban lain di sini, karena mereka menerangi bagian-bagian berbeda dari pertanyaan. Saya menggambarkan pendekatan Pearl terhadap sebab-akibat, dan khususnya pendapat saya tentang hal itu di beberapa makalah bersama Kevin Korb. Woodward mungkin memiliki akun nonteknis yang paling jelas.

  • @conjugateprior mengatakan "setiap sistem yang dikendalikan adalah contoh tandingan". Ya, pada klaim yang lebih kuat bahwa nonkorelasi yang diamati dalam percobaan Anda tidak menyiratkan penyebab. Saya akan menganggap pertanyaannya lebih umum. Tentu saja satu percobaan mungkin telah gagal mengendalikan untuk menutupi penyebab, atau dikendalikan secara tidak tepat untuk efek umum, dan menyembunyikan korelasinya. Tetapi jika menyebabkan , akan ada percobaan terkontrol di mana hubungan itu terungkap. Hampir semua definisi atau penjelasan sebab akibat memperlakukannya sebagai perbedaan yang membuat perbedaan. Karenanya tidak ada sebab akibat tanpa (semacam) korelasi. Jika ada tautan langsung dalam jaringan Bayesian kausal, itu tidak berartixyxyx selalu membuat perbedaan untuk , hanya saja ada beberapa percobaan yang memperbaiki semua penyebab lain mana goyangan goyangan .yyxy

  • @aksakal memiliki contoh yang bagus mengapa penyebab linear tidak cukup. Setuju, tapi saya ingin luas dan tidak teknis. Jika , tidak lengkap untuk memberi tahu klien bahwa tidak berkorelasi dengan . Jadi saya akan menggunakan korelasi secara luas untuk mengartikan perbedaan dalam yang secara andal dikaitkan dengan perbedaan dalam . Ini bisa sama nonlinear atau nonparametrik yang Anda inginkan. Efek ambang batas baik-baik saja ( membuat perbedaan untuk , tetapi hanya pada rentang yang terbatas, atau hanya dengan menjadi lebih besar atau lebih kecil dari nilai tertentu, seperti tegangan pada sirkuit digital).y=x2yxxyxy

  • @Kodiologist menciptakan contoh di mana , jaditetapi tidak ada korelasi linier. Tapi jelas ada hubungan yang bisa ditemukan, jadi berkorelasi dalam arti luas.| y | = | x |y=Unif(x,x)|y|=|x|

  • @Szabolcs menggunakan generator angka acak untuk menunjukkan aliran output yang dibangun agar tampak tidak berkorelasi. Seperti digit , aliran tampak acak tetapi deterministik. Saya setuju Anda tidak akan menemukan hubungan jika hanya diberikan data, tetapi ada di sana.π

  • @Li Zhi mencatat Anda tidak bisa secara logis melompat dari korelasi ke sebab-akibat. Ya, tidak ada penyebab, tidak ada penyebab. Tetapi pertanyaannya dimulai dari sebab-akibat: apakah itu menyiratkan korelasi? Dalam contoh tekanan udara, kami memiliki efek ambang batas. Ada kisaran di mana tekanan udara tidak berkorelasi dengan kesehatan. Memang masuk akal di mana ia tidak memiliki efek kausal pada kesehatan. Tetapi ada rentang di mana itu terjadi. Itu sudah cukup. Tetapi mungkin lebih baik untuk mencatat rentang di mana ada dan tidak berpengaruh. Jika , maka ada korelasi di sepanjang rantai, karena ada sebab-akibat. Pengamatan berulang (atau percobaan) dapat menunjukkan bahwa tidak secara langsung menyebabkanA DABCDAD tetapi korelasinya ada karena ada cerita sebab akibat.

Saya tidak tahu apa yang ada di pikiran @ user2088176, tapi saya pikir jika kita mengambil pertanyaan secara umum, maka jawabannya adalah ya. Setidaknya saya pikir itulah jawaban yang diperlukan dari literatur penemuan sebab akibat dan penjelasan intervensionis tentang sebab akibat. Penyebab adalah perbedaan yang membuat perbedaan. Dan perbedaan itu akan terungkap, dalam beberapa percobaan, sebagai hubungan persisten.

ctwardy
sumber
1
Saya berharap untuk mendekati ini dari perspektif yang lebih sederhana dan non-teknis, seperti yang Anda miliki. Apa artinya "menyebabkan"? Agaknya itu melibatkan perubahan pada sesuatu yang mengarah pada perubahan pada sesuatu yang lain. Saya tidak dapat memahami hubungan sebab akibat tanpa semacam korelasi.
Behacad
1
@ Behacad Saya pikir kontrasnya adalah antara beberapa jenis korelasi (hal yang dapat Anda amati) dan beberapa jenis ketergantungan (yang mungkin tidak pernah dipicu). Ada dependensi yang tidak terpicu tetapi tidak ada korelasi yang tidak teramati. Inilah sebabnya mengapa sebab akibat memiliki elemen kontrafaktual dengan definisinya, sedangkan korelasi tidak.
conjugateprior