Teori Kausalitas Mana Yang Harus Saya Ketahui?

16

Pendekatan teoritikal apa yang harus saya ketahui sebagai ahli statistik / ekonometrik terapan?

Saya tahu (sedikit)

Konsep apa yang saya lewatkan atau harus saya sadari?

Terkait: Teori mana yang menjadi dasar kausalitas dalam pembelajaran mesin?

Saya telah membaca pertanyaan-pertanyaan menarik ini dan jawabannya ( 1 , 2 , 3 ) tetapi saya pikir ini adalah pertanyaan yang berbeda. Dan saya sangat terkejut melihat bahwa "kausalitas", misalnya, tidak disebutkan dalam Elemen Pembelajaran Statistik .

Arne Jonas Warnke
sumber
2
Lihatlah ulasan Andrew Gelman tentang beberapa karya tentang kausalitas dalam AJS: Gelman, A. (2011). Kausalitas dan Pembelajaran Statistik. American Journal of Sociology, 117 (3), 955-966. doi: 10.1086 / 662659 . Ini adalah ikhtisar singkat kausalitas dalam ilmu sosial dengan referensi spesifik untuk karya-karya Rubin dan Pearl, serta beberapa yang lain. Tempat yang bagus untuk menjelajahi referensi.
paqmo
1
Untuk mulai dengan, (John Stuart) metode Mill. en.wikipedia.org/wiki/Mill's_Methods
noumenal
Lihat komentar saya di bawah jawaban yang diterima mengenai kemungkinan salah tafsir atas kausalitas Granger di sana.
Richard Hardy

Jawaban:

17

B

Meskipun hampir tidak kontroversial bahwa penyebab harus mendahului efeknya dalam waktu, untuk menarik kesimpulan kausal dengan prioritas waktu, Anda masih perlu mengklaim tidak adanya faktor pembaur, di antara sumber lain dari asosiasi palsu.

Sekarang mengenai Potensi Hasil (Neyman-Rubin) versus Grafik Kausal / Pemodelan Persamaan Struktural (Pearl), saya akan mengatakan ini adalah dilema yang salah dan Anda harus mempelajari keduanya.

Pertama, penting untuk memperhatikan bahwa ini bukan pandangan yang berlawanan tentang kausalitas . Seperti yang dikatakan Pearl, ada hierarki tentang tugas inferensi (kausal):

  1. Prediksi pengamatan
  2. Prediksi di bawah intervetion
  3. Counterfactuals

Untuk tugas pertama Anda hanya perlu mengetahui distribusi bersama dari variabel yang diamati. Untuk tugas kedua Anda perlu mengetahui distribusi bersama dan struktur sebab akibat. Untuk tugas terakhir, kontrafaktual, Anda akan lebih membutuhkan informasi tentang bentuk-bentuk fungsional dari model persamaan struktural Anda.

Jadi, ketika berbicara tentang kontrafaktual, ada kesetaraan formal antara kedua perspektif . Perbedaannya adalah bahwa hasil potensial mengambil pernyataan kontrafaktual sebagai primitif dan dalam kontrafaktual DAG tampaknya berasal dari persamaan struktural. Namun, Anda mungkin bertanya, jika mereka "setara", mengapa repot-repot belajar keduanya? Karena ada perbedaan dalam hal "kemudahan" untuk mengekspresikan dan menurunkan hal-hal.

Sebagai contoh, cobalah untuk mengekspresikan konsep M-Bias hanya menggunakan hasil potensial --- Saya belum pernah melihat yang bagus. Faktanya, pengalaman saya sejauh ini adalah bahwa para peneliti yang tidak pernah mempelajari grafik bahkan tidak menyadarinya. Selain itu, memberikan asumsi substantif dari model Anda dalam bahasa grafis akan membuatnya lebih mudah secara komputasi untuk mendapatkan implikasi empiris yang dapat diuji dan menjawab pertanyaan pengidentifikasian. Di sisi lain, kadang-kadang orang akan merasa lebih mudah untuk pertama-tama berpikir langsung tentang para kontrafaktual itu sendiri, dan menggabungkannya dengan asumsi parametrik untuk menjawab pertanyaan yang sangat spesifik.

Ada banyak lagi yang bisa dikatakan, tetapi intinya di sini adalah Anda harus belajar bagaimana "berbicara kedua bahasa". Untuk referensi, Anda dapat memeriksa cara memulai di sini.

Carlos Cinelli
sumber
1
Bisakah Anda memberikan contoh sesuatu yang mudah diungkapkan dalam hal PO, tetapi tidak dalam DAG?
Guilherme Duarte
Misalnya
Carlos Cinelli
3
AGrangerBABB
@ RichardHardy Saya pikir Anda benar, mungkin ayam jago sempurna yang berkokok selalu satu jam sebelum matahari terbit dapat memiliki beberapa kekuatan prediksi di luar model linear deret waktu matahari terbit (karena matahari terbit tidak persis sama setiap hari), tetapi dengan model sempurna mungkin tidak menambahkan apa pun.
Carlos Cinelli
Saya pikir kausalitas Granger tidak menyarankan penggunaan model prediksi inferior dengan hanya sejarah B untuk membenarkan kebutuhan untuk variabel tambahan A dan karenanya kausalitas Granger. Alih-alih, seseorang idealnya akan mencari model sebaik mungkin menggunakan sejarah B sendiri dan kemudian melihat apakah menambahkan A (dalam beberapa bentuk) membantu memprediksi B. Dan tentu saja, "ayam yang sempurna" adalah konsep yang agak utopis. Mengingat ini, saya pikir mengedit jawaban untuk mencerminkan ini mungkin ide yang bagus.
Richard Hardy