Saya tahu pertanyaan ini telah ditanyakan satu miliar kali, jadi, setelah mencari online, saya sepenuhnya yakin bahwa korelasi antara 2 variabel tidak menyiratkan sebab-akibat. Dalam salah satu kuliah statistik saya hari ini, kami mendapat kuliah tamu dari seorang ahli fisika, tentang pentingnya metode statistik dalam fisika. Dia mengatakan pernyataan yang mengejutkan:
korelasi tidak menyiratkan sebab-akibat, KECUALI salah satu variabel adalah waktu. Jadi, jika ada korelasi kuat antara beberapa variabel independen dan waktu, maka ini menyiratkan sebab-akibat juga.
Saya belum pernah mendengar pernyataan ini sebelumnya. Apakah fisikawan / relativis melihat "Sebab-akibat" berbeda dari statistik orang?
correlation
mathematical-statistics
causality
Thomas Moore
sumber
sumber
Jawaban:
Saya akan memberikan jawaban lain, karena saya pikir yang saat ini disediakan kehilangan poin penting dari pernyataan yang dibuat fisikawan. Pernyataan yang dikutip adalah:
Fisikawan tidak mengatakan:
Itu tidak benar. Apa fisikawan yang katakan adalah:
Contohnya mungkin entropi. Jika kita memiliki korelasi yang kuat antara berlalunya waktu dan peningkatan entropi, maka kita dapat mengatakan bahwa peningkatan waktu menyebabkan peningkatan entropi. Perhatikan bahwa ini mengabaikan apa penyebab fisik dari peningkatan entropi (pembusukan partikel, perluasan semesta, dll.).
Salah satu persyaratan tradisional untuk sebab-akibat adalah perkembangan waktu, yaitu bahwa X hanya dapat menyebabkan Y jika X datang sebelum Y. Tetapi jika salah satu variabel Anda ADALAH waktu, maka perkembangan waktu sudah tertanam dalam hubungan (jika ada hubungan).
EDIT: Berdasarkan berbagai komentar, saya akan menambahkan yang berikut ini. Saya pikir fisikawan itu mungkin menggunakan ide berbeda dari kata "sebab-akibat" di sini. Dia tampaknya mengatakan bahwa jika ada korelasi antara variabel independen dan waktu, Anda dapat menyimpulkan bahwa variabel independen berubah sesuai prediksi seiring berjalannya waktu. Beberapa orang mungkin mengatakan perubahan itu "disebabkan" oleh berlalunya waktu, ini bukan cara para ahli statistik menggunakan kata-kata "penyebab" atau "sebab-akibat", sehingga mungkin menyebabkan beberapa kebingungan.
sumber
Kami tidak tahu apa yang dimaksud fisikawan itu. Dua interpretasi berbeda mengikuti.
Klaim bahwa mendahului Y dan dihubungkan dengan Y menyiratkan bahwa X menyebabkan Y salah. Ini tidak cukup untuk X dan Y menjadi tergantung bahkan jika X mendahului Y . Misalnya, X dan Y keduanya dapat disebabkan oleh beberapa variabel lain W : X ← W → Y . Atau, pola yang lebih rumit dapat muncul: X ← V → Z ← W → Y di mana ZX Y Y X Y X Y X Y X Y W X←W→Y X←V→Z←W→Y Z diamati. Sekarang dan Y tergantung dan tidak memiliki penyebab yang sama, tetapi tidak ada yang menyebabkan yang lain.X Y
Namun, prioritas temporal sangat menyederhanakan kondisi untuk menyatakan hubungan sebab akibat, yang dapat Anda temukan dalam buku Kausalitas Pearl Bab 2.7 "Kriteria lokal untuk hubungan sebab akibat".
Pada dasarnya, (1) menyiratkan bahwa adalah penyebab potensial Y mengingat prioritas temporal, dan (2) menyiratkan bahwa X mampu memutuskan hubungan itu, yang hanya dapat terjadi jika X menyebabkan YZ Y X X Y .
Kondisi ini jauh lebih sederhana daripada definisi Pearl untuk tujuan asli tanpa informasi sementara.
Kemungkinan lain diuraikan dalam beberapa jawaban yang lain adalah bahwa fisikawan berarti bahwa jika adalah berlalunya waktu dan itu berkorelasi dengan Y , maka X menyebabkan Y . Pernyataan ini benar, tetapi kosong karena berlalunya waktu adalah penyebab dari semua variabel lain, yang saya maksudkan bahwa struktur grafis kausal adalah seperti ini. Struktur grafis kausal adalah seperangkat klaim tentang hubungan kemandirian yang diberikan pengamatan dan intervensi.X Y X Y
sumber
Saya berspekulasi bahwa dosen tamu Anda berarti bahwa dalam fisika satu-satunya korelasi yang bertahan replikasi adalah yang ada di mana ada hubungan sebab akibat yang mendasarinya. Variabel waktu adalah pengecualian karena itu adalah satu-satunya variabel yang tidak dikendalikan oleh fisikawan. Inilah sebabnya.
Dalam fisika kita biasanya berurusan dengan fenomena dan eksperimen yang berulang. Sebagai soal fakta, hampir setiap percobaan dapat diulang, dan dapat direplikasi oleh Anda di lain waktu atau oleh peneliti lain. Jadi, katakanlah Anda mengamati sampel di mana adalah pengamatan dari variabel minat dan variabel independen x k . Seperti yang saya sebutkan di atas kami sepenuhnya mengontrol variabel x kyi,xki xk xk , dan dapat mengatur mereka untuk nilai apapun yang kita inginkan.
Pria fisikawan Anda mengatakan bahwa dalam pengaturan ini Anda tidak akan melihat korelasi kecuali ada tautan sebab-akibat. Mengapa? Karena orang lain atau bahkan Anda sendiri akan mengulangi percobaan dengan kombinasi dan urutan x k j , dan hanya korelasi dengan hubungan kausal akan bertahan ulangan dari sebuah eksperimen. Semua korelasi (palsu) lainnya akan hilang setelah Anda mengumpulkan data yang cukup dalam semua kemungkinan kombinasi percobaan.Corr[y,xk] xk j
Situasi ini sangat kontras dengan ilmu sosial dan beberapa aplikasi bisnis di mana Anda tidak dapat melakukan eksperimen. Anda hanya mengamati satu urutan PDB suatu negara, dan tidak dapat mengubah tingkat pengangguran yang menyamakan semua dan mengamati korelasinya.
Sekarang, waktu adalah satu-satunya variabel yang tidak dapat dikontrol oleh fisikawan. Hanya ada satu Jan 1 2017. Dia tidak bisa mengulangi hari ini. Dia dapat mengulangi variabel lain apa pun, tetapi tidak waktu. Itu sebabnya ketika datang ke waktu ( bukan waktu atau usia murtad), seorang fisikawan berada di kapal yang sama dengan orang lain: korelasi tidak menyiratkan sebab-akibat baginya.
sumber
Saya belum pernah mendengar ini sebelumnya, dan itu tidak akan benar sesuai dengan konsepsi kausalitas yang saya kenal (meskipun saya bukan seorang ahli fisika).
Biasanya, untuk penyebabnya Y itu diperlukan bahwa X mendahului Y dalam waktu. Jadi, jika Y mendahului X maka itu tidak dapat "disebabkan" oleh X , terlepas dari korelasi apa pun. Selain itu, X sebelum Y bukanlah kondisi yang cukup untuk penyebab (juga terlepas dari korelasi apa pun).X Y X Y Y X X X Y
sumber
Saya tidak berpikir waktu harus unik dalam hal ini, tetapi tentu saja ini contoh yang baik. Intinya adalah bahwa biasanya jika A & B berkorelasi, Anda dapat menduga bahwa ada beberapa kausalitas umum, tetapi Anda tidak tahu apakah A menyebabkan B atau B menyebabkan A, atau mungkin variabel ketiga C menyebabkan A & B. Namun, , dalam kasus-kasus tertentu, Anda dapat mengesampingkan bahwa variabel lain mana pun yang menyebabkan A, dan itu pasti karena A yang menyebabkan B. Salah satu contohnya adalah eksperimen terkontrol, di mana Anda , eksperimen, kontrol A. Kemudian jika perubahan yang Anda buat dalam A "berkorelasi" dengan perubahan B, Anda tahu itu pasti A yang menyebabkan B berubah, bukan sebaliknya.
Jenis skenario lain, yang merupakan salah satu contoh dengan waktu ini, adalah jika Anda hanya tahu bahwa tidak ada variabel lain yang dapat menyebabkan A karena Anda tahu bahwa tidak ada hal apa pun yang dapat memengaruhi A. Karena waktu hanya mengalir satu detik pada satu waktu tanpa peduli dari variabel lain mana pun di dunia, maka jika waktu berkorelasi dengan perubahan dalam beberapa variabel yang Anda minati (katakanlah, jumlah orang di planet ini), Anda tahu pasti bahwa perjalanan waktu pasti menyebabkan variabel tersebut berubah, alih-alih daripada variabel Anda yang menyebabkan waktu berlalu atau berubah (yaitu waktu tidak berjalan karena lebih banyak orang dilahirkan, itu harus sebaliknya).
Apa yang masih belum Anda ketahui, tentu saja, adalah apakah kausalitas itu langsung. Agaknya perjalanan waktu itu sendiri tidak secara otomatis menghasilkan lebih banyak manusia. Melainkan, sejarah yang terbuka menyebabkan kemajuan dalam berbagai aspek masyarakat, dan ini menyebabkan populasi bertambah besar (dan bahkan itu adalah penyederhanaan dari banyak hubungan kausatif kecil). Tetapi terlepas dari faktor-faktor yang berperan, Anda tentu tahu bahwa A (akhirnya) mengarah ke B dan bukan sebaliknya.
sumber
Sebenarnya, korelasi memang menyiratkan hubungan kausal.
Mungkin A menyebabkan B, atau C menyebabkan A dan B.
Namun, korelasi tidak membuktikan sebab akibat.
Ini terbukti dengan sendirinya.
sumber
Saya akan menafsirkan ini sebagai argumen semantik daripada matematika / statistik. Saya juga akan menganggapnya sebagai generalisasi yang agak parah.
Itu Bradford Bukit Kriteria , sering digunakan dalam epidemiologi, menyediakan kerangka kerja yang baik untuk berpikir tentang sebab-akibat. Tidak ada yang dapat membuktikan sebab akibat secara pasti, apakah waktu adalah faktor atau tidak, dan saya curiga dosen itu tidak berusaha membuat pernyataan yang kuat. Namun, banyak faktor berbeda dapat digunakan sebagai argumen yang masuk akal untuk sebab-akibat.
Sebagai contoh, kriteria Bradford Hill menunjukkan bahwa kekuatan hubungan antara variabel dapat memberikan bukti untuk penyebab, tetapi tidak dengan sendirinya cukup. Demikian pula, asosiasi yang konsisten dengan fakta-fakta lain yang diketahui / dipercayai mungkin menyarankan sebab-akibat lebih kuat daripada asosiasi yang tidak konsisten dengan pengetahuan yang ada. Temporalitas juga merupakan salah satu kriteria - sebab harus mendahului efeknya. Suatu asosiasi, dan kesimpulan yang kita buat tentang sebab akibat, harus masuk akal secara temporal. Saya merekomendasikan meninjau kriteria lain. Beberapa khusus untuk epidemiologi dan tidak berlaku untuk fisika tetapi masih merupakan cara berpikir yang berguna.
Poin utamanya adalah bahwa, sementara tidak ada satu pun bukti yang akan membuktikan sebab-akibat secara definitif, Anda dapat membuat kasus yang bagus untuk itu berdasarkan pada sejumlah pemeriksaan logis yang berbeda. Saya berpendapat bahwa memberikan prioritas mutlak pada salah satu kriteria, seperti waktu, tidak tepat, tetapi temporalitas dapat menjadi faktor penting ketika membuat kasus bahwa sebab-akibat masuk akal.
Ini mengarah ke titik yang lebih luas tentang statistik: secara umum, kami menggunakan statistik untuk membuat argumen. Kami menggunakan data dan alat statistik untuk membuat poin tertentu. Seringkali, data yang sama (dan bahkan alat yang sama) dapat digunakan untuk membuat poin yang bertentangan. Kami tidak dapat menemukan bukti pasti penyebab dalam matematika itu sendiri, tetapi kami dapat menggunakan alat statistik kami sebagai bagian dari argumen yang lebih luas. Untuk lebih lanjut tentang itu, saya merekomendasikan Statistik Abelson sebagai Argumen Berprinsip.
Untuk mengulang ini kembali ke situasi semula, katakanlah Anda telah melakukan percobaan tentang efek konsentrasi bahan kimia tertentu dalam larutan pada suhu larutan itu. Anda menduga bahwa menambahkan lebih banyak bahan kimia ini akan menghasilkan reaksi yang meningkatkan suhu. Anda menambahkan lebih banyak dari waktu ke waktu. Anda dapat melihat suhu terhadap waktu dan melihat peningkatan. Semua ini menunjukkan bahwa suhu meningkat seiring waktu; itu tidak membuktikan bahwa waktu itu sendiri (atau apa pun, dalam hal ini) memiliki efek kausal. Namun, hal itu memberikan beberapa bukti dalam argumen yang lebih luas bahwa peningkatan konsentrasi bahan kimia ini menghasilkan reaksi yang meningkatkan suhu.
sumber
Kalimat ini cukup sederhana dan tidak layak untuk dipikirkan ulang (dan tidak ada hubungannya dengan prioritas).
Jika ada didirikan korelasi antara variabel dan waktu (yaitu kita tahu bahwa peningkatan waktu yang disertai dengan peningkatan variabel, dan ini adalah diberikan ), maka kita tahu "kausal" arah: yaitu waktu meningkat, penyebab variabel meningkat.
Karena hipotesis alternatif "nah-uh, bisa jadi waktu hanya meningkat karena variabel meningkat pertama " tidak bisa bertahan mengingat cara waktu bekerja.
Ini mungkin terdengar seperti pengamatan konyol, tetapi memiliki implikasi penting bagi desain penelitian yang mencoba membuktikan arah kausal. Contoh penting dalam kedokteran adalah perbedaan antara melakukan studi cross-sectional dan kohort.
Misalnya, penelitian lintas seksi yang mencoba menemukan hubungan antara merokok dan kanker mungkin mengambil sekelompok orang, membaginya menjadi perokok vs bukan perokok, dan melihat berapa banyak di setiap kelompok yang menderita kanker vs tidak kanker. Namun, ini adalah bukti yang lemah karena korelasi antara merokok dan kanker juga dapat diartikan sebagai "orang yang menderita kanker lebih mungkin menikmati merokok."
Namun, jika Anda melakukan studi kohort, yaitu mengambil sekelompok perokok dan sekelompok non-perokok, dan menindaklanjuti mereka melalui waktu, dan mengukur variabel "kanker pada perokok dikurangi kanker pada non-perokok", dan membangun positif korelasi variabel ini dengan waktu, (di bawah asumsi yang masuk akal, sehingga jumlah merokok setelah dimulai adalah konstan dan tidak tergantung waktu, dll) maka Anda tahu bahwa "waktu" adalah penyebab perbedaan kanker, karena Anda tidak dapat mengklaim bahwa peningkatan angka kanker menyebabkan waktu untuk lulus lebih banyak dalam kelompok merokok. Oleh karena itu Anda dapat mengklaim penyebab antara berlalunya waktu dan perbedaan kanker positif terkait dengan tingkat yang lebih tinggi pada kelompok perokok. (atau, lebih tepatnya dinyatakan, waktu yang dihabiskan milik kelompok merokok menyebabkan peningkatan risiko kanker secara proporsional).
Lebih lanjut, kelemahan dari studi cross-sectional, yaitu kemungkinan bahwa "orang dengan kanker lebih mungkin untuk berhenti merokok" sekarang telah keluar dari jendela, karena merokok sebagai variabel telah diambil dari "waktu vs kanker" persamaan (di sini diasumsikan konstan dan karena itu tidak terpengaruh oleh waktu). Dengan kata lain, dengan merumuskan penelitian dengan cara ini, kami telah memeriksa arah sebab akibat yang sangat spesifik . Jika kita ingin memeriksa sejauh mana arah kausal terbalik berlaku (yaitu seberapa besar kemungkinan orang yang pada akhirnya akan terkena kanker akan berhenti merokok seiring berjalannya waktu), maka kita harus merancang sebuah studi kohort yang dipecah menjadi "kanker masa depan vs kanker yang tidak ada masa depan" dan mengukur penggunaan rokok dari waktu ke waktu.
Perbarui menanggapi komentar:
Perhatikan bahwa ini adalah diskusi tentang arah sebab akibat dan bukan salah satu dari menemukan hubungan sebab akibat langsung. Pertanyaan perancu adalah pertanyaan yang terpisah. (Yaitu tidak ada yang menunjukkan bahwa tidak ada variabel ketiga independen yang keduanya membuat Anda lebih mungkin menjadi perokok dan meningkatkan peluang Anda terkena kanker seiring waktu). Yaitu, dalam hal kausalitas kontrafaktual, kami belum secara definitif menunjukkan bahwa "jika bukan karena merokok orang-orang ini tidak akan terkena kanker". Tetapi kami punyamenunjukkan bahwa "hubungan antara kelompok merokok dan kanker tidak akan meningkat jika waktu tidak berlalu". (Yaitu asosiasi tidak sampai ke snapshot penderita kanker preferensi semata-mata untuk berada di kelompok merokok atau tidak, tetapi diperkuat dari waktu ke waktu).
sumber
Ini benar-benar sebuah pertanyaan tentang bagaimana membangun kausalitas, karena peristiwa-peristiwa yang terkait tetapi tidak kausatif cenderung berkorelasi dalam ruang atau waktu. Jadi melihat beberapa data yang berkorelasi, bagaimana kita bisa menentukan apakah hubungan itu tergantung? Seorang penasihat penelitian yang bijak pernah mengatakan kepada saya, "korelasi tidak menyiratkan sebab-akibat, itu hanya memberi tahu Anda ke mana harus mencari".
Mari kita pertimbangkan situasi di mana peristiwa A dan B ditemukan berkorelasi temporal atau spasial. Jika kita ingin menyelidiki preposisi bahwa A menyebabkan B , garis pemikiran tradisional adalah memperkenalkan tes kebutuhan dan kecukupan - yang merupakan arti kausalitas sesungguhnya.
Jika tidak memiliki susu menyebabkan saya pergi ke toko , apa yang kita katakan bukanlah saya memasukkan susu kosong dan menyetir. Kausalitas absolut berarti bahwa setiap kali saya masih memiliki susu , saya tidak dapat diganggu untuk pergi ke toko; dan sebaliknya setiap kali saya di toko, itu karena saya tidak punya susu. Sekarang mudah untuk melihat masalah dengan membangun kausalitas secara positif dalam arti yang ketat: kebanyakan hal tidak sepenuhnya bersifat kausal. Ada banyak alasan lain mengapa saya pergi ke toko yang tidak ada hubungannya dengan keadaan susu.
Ini adalah cara mudah untuk mengatakan kertas yang bagus dari kertas yang bagus. Dalam penelitian yang cermat, Anda akan melihat tes kecukupan dan kebutuhan di mana-mana. Membuat klaim bahwa obat molekul kecil A dapat menyebabkan pembongkaran protein kompleks B? Anda akan segera melihat tes:
kebutuhan
----test---- ----result---- everything but B --> [nothing] (check for false positive) everything but A --> assembled everything with A-like compound --> assembled (control group)
kecukupan
A + B alone (in vitro) --> disassembled (check for false negative) A + B + everything --> disassembled (trial group)
Ini adalah cara tradisional Anda membangun argumen induktif untuk kausalitas secara eksperimental MENGGUNAKAN korelasi, yang mana saya yakin dosen Anda tidak terlibat!
sumber