Katakanlah saya punya tabel dengan kolom "A", "B"
Apakah ada metode statistik untuk menentukan apakah "A" menyebabkan "B" terjadi? Seseorang tidak dapat menggunakan Pearson's r, karena:
- hanya menguji korelasi antara nilai-nilai
- korelasi bukanlah sebab-akibat
- Pearson's r hanya dapat menghubungkan hubungan linier
Jadi, opsi apa lagi yang saya miliki di sini?
correlation
causality
chutsu
sumber
sumber
Jawaban:
Jawaban dan komentar sejauh ini pada dasarnya benar pada tingkat praktis, tetapi untuk kelengkapan, ada penelitian ke dalam apa yang disebut model kausalitas yang didasarkan pada statistik Bayesian dan teori grafik. Jadi meskipun dalam korelasi umum memang tidak menyiratkan sebab-akibat, ada model yang lebih kompleks yang berupaya untuk menghilangkan sebab-akibat. Lihat buku Kausalitas oleh Judea Pearl untuk detail lebih lanjut, tetapi ini matematika yang sangat berat dan mungkin bukan yang Anda inginkan.
sumber
Ada banyak yang disebut metode eksperimen semu yang dengannya Anda dapat berdebat tentang kausalitas, meskipun data Anda bersifat observasional. Metode-metode ini biasanya bergantung pada menemukan sumber variasi eksogen dalam variabel yang Anda minati.
Saya pikir gambaran yang baik dan dapat diakses diberikan dalam buku "Mostly Harmless Econometrics". Mereka pada dasarnya mencakup semua metode eksperimen semu yang diyakini orang (artinya: ekonom) (setidaknya kadang-kadang). Mereka tidak mencakup metode yang disebutkan oleh misalnya trb456 (untuk alasan yang sama: tidak banyak yang mempercayainya).
sumber
Untuk menentukan sebab-akibat Anda perlu melakukan tes pengacakan. Anda mengambil subjek tes Anda, dan secara acak memilih setengah dari mereka untuk memiliki kualitas A dan setengah untuk tidak memilikinya. Anda kemudian melihat apakah ada perbedaan yang signifikan secara statistik dalam kualitas B antara kedua kelompok.
Perhatikan bahwa mungkin tidak mungkin untuk melakukan tes pengacakan yang ingin Anda lakukan. Misalnya, bagaimana Anda bisa menguji jika tinggi menyebabkan Anda lebih berat? Tentu saja ada korelasi antara tinggi dan berat badan, tetapi Anda tidak dapat secara acak menetapkan satu kelompok orang ke kelompok 'tinggi' dan satu ke kelompok 'pendek'. Dalam hal ini, uji pengacakan tidak dapat dilakukan.
sumber
Somers akan bekerja untuk menjelaskan hubungan antara variabel ordinal dengan cara yang dilakukan koefisien korelasi pearson untuk set data.
sumber