Ada pepatah lama: "Korelasi tidak berarti sebab akibat". Ketika saya mengajar, saya cenderung menggunakan contoh-contoh standar berikut untuk menggambarkan hal ini:
- jumlah bangau dan tingkat kelahiran di Denmark;
- jumlah imam di Amerika dan alkoholisme;
- pada awal abad ke-20 tercatat bahwa ada korelasi kuat antara 'Jumlah radio' dan 'Jumlah orang di Rumah Sakit Gila'
- dan favorit saya: bajak laut menyebabkan pemanasan global .
Namun, saya tidak punya referensi untuk contoh-contoh ini dan walaupun lucu, mereka jelas salah.
Adakah yang punya contoh bagus lainnya?
correlation
teaching
csgillespie
sumber
sumber
Jawaban:
Mungkin bermanfaat untuk menjelaskan bahwa "sebab" adalah hubungan asimetris (X sebab Y berbeda dari Y sebab X), sedangkan "berkorelasi dengan" adalah hubungan simetris.
Misalnya, populasi tuna wisma dan tingkat kejahatan mungkin berkorelasi, karena keduanya cenderung tinggi atau rendah di lokasi yang sama. Sama validnya dengan mengatakan bahwa populasi tunawisma berkorelasi dengan tingkat kejahatan, atau tingkat kejahatan berkorelasi dengan populasi tunawisma. Untuk mengatakan bahwa kejahatan menyebabkan tuna wisma, atau populasi tuna wisma menyebabkan kejahatan adalah pernyataan yang berbeda. Dan korelasi tidak menyiratkan bahwa keduanya benar. Misalnya, penyebab yang mendasari bisa menjadi variabel ke-3 seperti penyalahgunaan narkoba, atau pengangguran.
Matematika statistik tidak baik dalam mengidentifikasi penyebab yang mendasarinya, yang membutuhkan beberapa bentuk penilaian lainnya.
sumber
Kesukaanku:
1) Semakin banyak petugas pemadam kebakaran dikirim ke api, semakin banyak kerusakan yang terjadi.
2) Anak-anak yang mendapat bimbingan belajar mendapat nilai lebih buruk daripada anak-anak yang tidak mendapatkan bimbingan belajar
dan (ini yang teratas)
3) Pada tahun-tahun awal sekolah dasar, tanda astrologi berkorelasi dengan IQ, tetapi korelasi ini melemah dengan bertambahnya usia dan menghilang pada usia dewasa.
sumber
Saya selalu menyukai yang ini:
sumber: http://pubs.acs.org/doi/abs/10.1021/ci700332k
sumber
Terkadang korelasi cukup. Misalnya, dalam asuransi mobil, pengemudi laki-laki berkorelasi dengan lebih banyak kecelakaan, sehingga perusahaan asuransi membebankan biaya lebih besar kepada mereka. Tidak mungkin Anda benar-benar dapat menguji penyebab ini. Anda tidak dapat mengubah jenis kelamin driver secara eksperimental. Google telah menghasilkan ratusan miliar dolar tidak peduli tentang penyebabnya.
Untuk menemukan sebab-akibat, Anda biasanya memerlukan data eksperimental, bukan data observasi. Meskipun, dalam ilmu ekonomi, mereka sering menggunakan "kejutan" yang diamati pada sistem untuk menguji sebab-akibat, seperti jika seorang CEO mati mendadak dan harga saham naik, Anda dapat mengasumsikan sebab-akibat.
Korelasi adalah kondisi yang diperlukan tetapi tidak cukup untuk menyebabkan. Untuk menunjukkan sebab akibat dibutuhkan suatu fakta yang berlawanan.
sumber
Saya punya beberapa contoh yang ingin saya gunakan.
Ketika menyelidiki penyebab kejahatan di New York City pada 80-an, ketika mereka berusaha membersihkan kota, seorang akademisi menemukan korelasi kuat antara jumlah kejahatan serius yang dilakukan dan jumlah es krim yang dijual oleh pedagang kaki lima! (Yang merupakan penyebab dan yang merupakan efeknya?) Jelas, ada variabel yang tidak diamati yang menyebabkan keduanya. Musim panas adalah saat kejahatan terbesar dan saat es krim paling banyak dijual.
Ukuran telapak tangan Anda berkorelasi negatif dengan berapa lama Anda akan hidup (sungguh!). Faktanya, wanita cenderung memiliki telapak tangan yang lebih kecil dan hidup lebih lama.
[Favorit saya] Saya pernah mendengar sebuah penelitian beberapa tahun yang lalu yang menemukan bahwa jumlah soda yang diminum seseorang berkorelasi positif dengan kemungkinan obesitas.(Saya berkata pada diri saya sendiri - itu masuk akal karena itu pasti karena orang minum soda manis dan mendapatkan semua kalori kosong itu.) Beberapa hari kemudian lebih banyak rincian yang keluar. Hampir semua korelasinya adalah karena peningkatan konsumsi minuman ringan diet. (Itu mengacaukan teoriku!) Jadi, ke arah mana penyebabnya? Apakah diet minuman ringan menyebabkan seseorang menambah berat badan, atau apakah kenaikan berat badan menyebabkan peningkatan konsumsi minuman ringan diet? (Sebelum Anda menyimpulkan itu adalah yang terakhir, lihat studi di mana percobaan terkontrol dengan tikus menunjukkan kelompok yang diberi yogurt dengan pemanis buatan naik lebih berat daripada kelompok yang diberi yogurt normal.) Dua referensi: Minum Lebih Banyak Diet Soda , Menambah Lebih Berat? ; Soda diet terkait dengan obesitas. Saya pikir mereka masih mencoba untuk menyelesaikan ini.
sumber
Jumlah hadiah Nobel yang dimenangkan oleh suatu negara (menyesuaikan populasi) berkorelasi baik dengan konsumsi cokelat per kapita. ( Jurnal Kedokteran New England )
sumber
Meskipun ini lebih merupakan ilustrasi dari masalah perbandingan ganda, ini juga merupakan contoh yang baik dari penyebab yang salah diatribusikan:
Rugby (agama Wales) dan pengaruhnya terhadap gereja Katolik: haruskah Paus Benediktus XVI khawatir?
sumber
Ada dua aspek untuk masalah post hoc ergo propter hoc ini yang ingin saya bahas: (i) membalikkan kausalitas dan (ii) endogenitas
Sebuah contoh dari "kemungkinan" membalikkan kausalitas: Minum dan penghasilan sosial - peminum menghasilkan lebih banyak uang menurut Bethany L. Peters & Edward Stringham (2006. "Tidak Ada Minuman Keras? Anda Dapat Kalah: Mengapa Peminum Menghasilkan Lebih Banyak Uang Daripada Bukan Peminum," Jurnal Tenaga Kerja Penelitian, Penerbit Transaksi, vol. 27 (3), halaman 411-421, Juni). Atau apakah orang yang mendapat lebih banyak uang minum lebih banyak karena mereka memiliki penghasilan yang lebih besar atau karena stres? Ini adalah makalah yang bagus untuk membahas berbagai alasan termasuk kesalahan pengukuran, bias respon, hubungan sebab akibat, dll.
Contoh endogenitas "mungkin": Persamaan Mincer menjelaskan pendapatan kayu gelondongan berdasarkan pendidikan, pengalaman, dan pengalaman yang dikuadratkan. Ada literatur panjang tentang topik ini. Ekonom tenaga kerja ingin memperkirakan hubungan kausal pendidikan dengan pendapatan, tetapi mungkin pendidikan bersifat endogen karena "kemampuan" dapat meningkatkan jumlah pendidikan yang dimiliki seseorang (dengan menurunkan biaya untuk memperolehnya) dan dapat menyebabkan peningkatan pendapatan, terlepas dari tingkat pendidikan. Solusi potensial untuk ini bisa menjadi variabel instrumental. Buku Angrist dan Pischke, Mostly Harmless Econometrics membahas hal ini dan mengaitkan berbagai topik dengan sangat detail dan jelas.
Contoh konyol lain yang tidak saya dukung adalah: - Jumlah televisi per kapita dan angka kematian. Jadi mari kita kirim TV ke negara-negara berkembang. Jelas keduanya bersifat endogen terhadap sesuatu seperti PDB. - Jumlah serangan hiu dan penjualan es krim. Keduanya mungkin bersifat endogen terhadap suhu?
Saya juga suka menceritakan lelucon mengerikan tentang orang gila dan labah-labah. Orang gila berkeliaran di koridor suaka dengan laba-laba yang dibawanya di telapak tangannya. Dia melihat dokter dan berkata, "Lihat Doc, aku bisa bicara dengan laba-laba. Lihat ini." Laba-laba, ke kiri! "Laba-laba itu bergerak ke kiri. Dia melanjutkan," Laba-laba, ke kanan. " kanan telapak tangannya. Dokter menjawab, "Menarik, mungkin kita harus membicarakan ini di sesi kelompok berikutnya." Orang gila balas, "Itu bukan apa-apa, Dok. Lihat ini. "Dia menarik setiap kaki laba-laba satu per satu dan kemudian berteriak," Laba-laba, belok kiri! "Laba-laba itu berbaring tak bergerak di telapak tangannya dan orang gila berpaling ke dokter dan menyimpulkan," Jika kamu melepaskan milik laba-laba kaki dia akan tuli. "
sumber
Yang terbaik yang pernah diajarkan kepada saya adalah jumlah tenggelam dan penjualan es krim mungkin sangat berkorelasi tetapi itu tidak menyiratkan satu menyebabkan yang lain. Tenggelam dan penjualan es krim jelas lebih tinggi di bulan-bulan musim panas ketika cuaca baik. Variabel ketiga alias cuaca yang baik menyebabkan mereka.
sumber
Sebagai generalisasi dari 'bajak laut yang menyebabkan pemanasan global': Pilih dua kuantitas yang (monotonik) meningkat atau menurun seiring waktu dan Anda akan melihat beberapa korelasinya.
sumber
Anda dapat menghabiskan beberapa menit di Google Correlate , dan menghasilkan semua jenis korelasi palsu.
sumber
Saya bekerja dengan siswa dalam mengajar korelasi vs sebab-akibat di kelas Aljabar Satu saya. Kami memeriksa banyak contoh yang mungkin. Saya menemukan artikel Bayi Bundel dan Es Krim Berbahaya: Puzzler Korelasi dari Guru Matematika Februari 2013 bermanfaat. Saya suka ide berbicara tentang "variabel mengintai". Juga kartun ini adalah pembuka percakapan yang lucu:
Kami mengidentifikasi variabel independen dan dependen dalam kartun dan berbicara tentang apakah ini merupakan contoh penyebab, jika tidak mengapa tidak.
sumber
Saya membaca (dahulu kala) tentang contoh menarik tentang penurunan angka kelahiran (atau tingkat kesuburan jika Anda lebih suka ukuran itu) terutama di AS, dimulai pada awal 1960-an, saat pengujian senjata nuklir berada pada titik tertinggi sepanjang masa. (pada tahun 1961 bom nuklir terbesar yang pernah diledakkan diuji di Uni Soviet). Tarif terus melukis hingga akhir abad kedua puluh ketika sebagian besar negara akhirnya berhenti melakukan ini.
Saya tidak dapat menemukan referensi yang menggabungkan angka-angka ini sekarang, tetapi artikel Wikipedia ini memiliki angka angka uji senjata nuklir oleh negara.
Tentu saja, mungkin lebih masuk akal untuk melihat korelasi tingkat kelahiran dengan pengenalan dan legalisasi pil kontrasepsi 'secara kebetulan' dimulai pada awal 1960-an. (Hanya di beberapa negara bagian pertama, kemudian semua negara bagian untuk wanita yang sudah menikah saja, kemudian beberapa untuk yang belum menikah, kemudian di seluruh papan), Tetapi bahkan itu hanya bisa menjadi bagian dari penyebabnya; banyak aspek lain dari kesetaraan, perubahan ekonomi, dan faktor-faktor lain memainkan peran penting.
sumber
Korelasi dengan sendirinya tidak pernah dapat membangun hubungan sebab akibat. David Hume (1771-1776) berargumen dengan cukup efektif bahwa kita tidak dapat memperoleh pengetahuan tertentu tentang cauasality dengan cara empiris murni. Kant berusaha mengatasi ini, halaman Wikipedia untuk Kant tampaknya merangkumnya dengan cukup baik:
Dengan kata lain, Hume memberi tahu kita bahwa kita tidak akan pernah tahu hubungan kausal ada hanya dengan mengamati korelasi, tetapi Kant menyarankan bahwa kita mungkin dapat menggunakan alasan kita untuk membedakan antara korelasi yang menyiratkan hubungan kausal dari mereka yang tidak. Saya tidak berpikir Hume tidak akan setuju, selama Kant menulis dalam hal masuk akal daripada pengetahuan tertentu.
Singkatnya, korelasi menyediakan bukti tidak langsung yang menyiratkan hubungan sebab akibat, tetapi bobot bukti sangat bergantung pada keadaan tertentu yang terlibat, dan kita tidak pernah bisa benar-benar yakin. Kemampuan untuk memprediksi efek dari intervensi adalah salah satu cara untuk mendapatkan kepercayaan diri (kami tidak dapat membuktikan apa pun, tetapi kami dapat membantah dengan bukti pengamatan, jadi kami setidaknya telah mencoba untuk memalsukan teori hubungan sebab akibat). Memiliki model sederhana yang menjelaskan mengapa kita harus mengamati korelasi yang juga menjelaskan bentuk-bentuk bukti lain adalah cara lain kita dapat menerapkan penalaran kita seperti yang disarankan Kant.
Kaisar peringatan: Sangat mungkin saya telah salah memahami filosofi, namun tetap saja suatu korelasi tidak pernah bisa memberikan bukti adanya hubungan sebab akibat.
sumber
sumber
Kutipan standar yang menunjukkan korelasi antara jumlah bayi baru lahir dan pasangan-pembiakan bangau di Jerman Barat adalah Parameter baru untuk pendidikan seks , Nature 332, 495 (07 April 1988); doi: 10.1038 / 332495a0
sumber
Hitungan sperma pada laki-laki di desa-desa di Slovenia dan jumlah beruang (juga di Slovenia) menunjukkan korelasi negatif. Beberapa orang merasa ini sangat mengkhawatirkan. Saya akan mencoba dan mendapatkan studi yang melakukan ini.
sumber
Saya baru-baru ini menghadiri konferensi dan salah satu pembicara memberikan contoh yang sangat menarik ini (walaupun intinya adalah untuk menggambarkan sesuatu yang lain):
Orang Amerika dan Inggris makan banyak makanan berlemak. Ada tingkat tinggi penyakit kardiovaskular di AS dan Inggris.
Orang Prancis makan banyak makanan berlemak, tetapi mereka memiliki tingkat penyakit kardiovaskular yang rendah.
Orang Amerika dan Inggris banyak minum alkohol. Ada tingkat tinggi penyakit kardiovaskular di AS dan Inggris.
Orang Italia banyak minum alkohol, tetapi sekali lagi, mereka memiliki tingkat penyakit kardiovaskular yang rendah.
Kesimpulannya? Makan dan minum apa yang Anda inginkan. Dan Anda memiliki peluang lebih tinggi terkena serangan jantung jika Anda berbicara bahasa Inggris!
sumber
Kartun kartun XKCD ini juga diposting di tempat lain di CrossValidated.
sumber
Contoh lain dari korelasi yang saya gunakan adalah peningkatan besar dalam jumlah orang yang makan makanan organik dan peningkatan jumlah anak yang didiagnosis dengan autisme di AS. Ada grafik parodi di web -
sumber
http://tylervigen.com/
Ini menunjukkan satu ton korelasi yang jelas tidak ada hubungannya dengan sebab-akibat - Atau apakah Anda punya ide bagus apa yang menyebabkan korelasi Age of Miss America berkorelasi dengan Pembunuhan oleh uap, uap panas dan benda panas
??
sumber
Mengajarkan "Korelasi tidak berarti sebab-akibat" tidak benar-benar membantu siapa pun karena pada akhirnya semua argumen deduktif sebagian didasarkan pada korelasi.
Manusia sangat buruk dalam belajar untuk tidak melakukan sesuatu.
Tujuannya seharusnya konstruktif: Selalu pikirkan alternatif untuk asumsi awal Anda yang mungkin menghasilkan data yang sama.
sumber
Nah Prof. saya menggunakan ini di kelas probabilitas Pendahuluan:
1) Ukuran sepatu berkorelasi dengan kemampuan membaca
2) Serangan hiu berkorelasi dengan penjualan es krim.
sumber
Semakin banyak pemadam kebakaran yang dikirim ke api, semakin besar kerusakannya.
sumber
Saya pikir paradigma yang lebih baik mungkin sebab-akibat memerlukan korelasi yang terkait dengan mekanisme yang kredibel dan lebih baik terbukti. Saya pikir kata menyiratkan harus digunakan sangat hemat dalam konteks ini, karena memiliki beberapa arti termasuk saran.
sumber
Contoh bangau ada di halaman 8 edisi pertama (1978) dari buku Box, Hunter & Hunter berjudul "Statistics for Experimenters ..." (Wiley). Saya tidak tahu apakah ini dalam edisi ke-2. Mereka mengidentifikasi kota sebagai Oldenburg dan periode waktu sebagai 1930-1936.
Mereka merujuk Ornithologische Monatsberichte , 44 , No 2, Jahrgang, 1936, Berlin, dan 48 , No 1, Jahrgang, 1940, Berlin, dan Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.
sumber
Saya melihat yang lucu di sebuah artikel.
Produksi mentega di Bangladesh memiliki salah satu korelasi tertinggi dengan S&P 500 selama sepuluh tahun.
sumber
Ini yang sempurna. Dan sayangnya, ini dapat digunakan sebagai poin pengajaran yang bagus karena baik staf Washington Post maupun Pusat Pengendalian dan Pencegahan Penyakit tidak menunjukkan bukti pengetahuan bahwa artikel tersebut harus menjadi bagian sindiran dalam The Onion.
https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837
sumber
Seseorang berkata, korelasi mungkin tidak berarti sebab-akibat tetapi pasti bisa menjadi petunjuk yang bagus :)
Ok kesampingkan bagian yang menyenangkan, apa sebenarnya penyebabnya? Apakah kita benar-benar yakin bahwa bajak laut tidak menyebabkan pemanasan global?
Kontra-intuitif, tetapi apa yang dianggap sebagai penyebab dan apa sebagai efek (dalam studi korelasi tidak begitu jelas). Tentu saja berkali-kali keduanya hanya bisa menjadi efek dari penyebab umum (dan dengan demikian berkorelasi)
Semuanya bermuara pada metode penentuan sebab-akibat.
Ini adalah penyebab (pun intended) perkataan:
Ada kebohongan kecil. Ada kebohongan besar dan ada statistik.
sumber