Pendekatan teoritikal apa yang harus saya ketahui sebagai ahli statistik / ekonometrik terapan?
Saya tahu (sedikit)
- Model kausal Neyman – Rubin (dan Roy , Haavelmo dll.)
- Karya Pearl tentang Kausalitas
- Granger Causality (meskipun kurang berorientasi pada perawatan)
Konsep apa yang saya lewatkan atau harus saya sadari?
Terkait: Teori mana yang menjadi dasar kausalitas dalam pembelajaran mesin?
Saya telah membaca pertanyaan-pertanyaan menarik ini dan jawabannya ( 1 , 2 , 3 ) tetapi saya pikir ini adalah pertanyaan yang berbeda. Dan saya sangat terkejut melihat bahwa "kausalitas", misalnya, tidak disebutkan dalam Elemen Pembelajaran Statistik .
machine-learning
causality
theory
treatment-effect
Arne Jonas Warnke
sumber
sumber
Jawaban:
Meskipun hampir tidak kontroversial bahwa penyebab harus mendahului efeknya dalam waktu, untuk menarik kesimpulan kausal dengan prioritas waktu, Anda masih perlu mengklaim tidak adanya faktor pembaur, di antara sumber lain dari asosiasi palsu.
Sekarang mengenai Potensi Hasil (Neyman-Rubin) versus Grafik Kausal / Pemodelan Persamaan Struktural (Pearl), saya akan mengatakan ini adalah dilema yang salah dan Anda harus mempelajari keduanya.
Pertama, penting untuk memperhatikan bahwa ini bukan pandangan yang berlawanan tentang kausalitas . Seperti yang dikatakan Pearl, ada hierarki tentang tugas inferensi (kausal):
Untuk tugas pertama Anda hanya perlu mengetahui distribusi bersama dari variabel yang diamati. Untuk tugas kedua Anda perlu mengetahui distribusi bersama dan struktur sebab akibat. Untuk tugas terakhir, kontrafaktual, Anda akan lebih membutuhkan informasi tentang bentuk-bentuk fungsional dari model persamaan struktural Anda.
Jadi, ketika berbicara tentang kontrafaktual, ada kesetaraan formal antara kedua perspektif . Perbedaannya adalah bahwa hasil potensial mengambil pernyataan kontrafaktual sebagai primitif dan dalam kontrafaktual DAG tampaknya berasal dari persamaan struktural. Namun, Anda mungkin bertanya, jika mereka "setara", mengapa repot-repot belajar keduanya? Karena ada perbedaan dalam hal "kemudahan" untuk mengekspresikan dan menurunkan hal-hal.
Sebagai contoh, cobalah untuk mengekspresikan konsep M-Bias hanya menggunakan hasil potensial --- Saya belum pernah melihat yang bagus. Faktanya, pengalaman saya sejauh ini adalah bahwa para peneliti yang tidak pernah mempelajari grafik bahkan tidak menyadarinya. Selain itu, memberikan asumsi substantif dari model Anda dalam bahasa grafis akan membuatnya lebih mudah secara komputasi untuk mendapatkan implikasi empiris yang dapat diuji dan menjawab pertanyaan pengidentifikasian. Di sisi lain, kadang-kadang orang akan merasa lebih mudah untuk pertama-tama berpikir langsung tentang para kontrafaktual itu sendiri, dan menggabungkannya dengan asumsi parametrik untuk menjawab pertanyaan yang sangat spesifik.
Ada banyak lagi yang bisa dikatakan, tetapi intinya di sini adalah Anda harus belajar bagaimana "berbicara kedua bahasa". Untuk referensi, Anda dapat memeriksa cara memulai di sini.
sumber