Apa definisi matematis dari hubungan sebab akibat antara dua variabel acak?
Diberikan sampel dari distribusi bersama dua variabel acak dan , kapan kita mengatakan menyebabkan ?
Untuk konteks, saya membaca makalah ini tentang penemuan kausal .
Apa definisi matematis dari hubungan sebab akibat antara dua variabel acak?
Diberikan sampel dari distribusi bersama dua variabel acak dan , kapan kita mengatakan menyebabkan ?
Untuk konteks, saya membaca makalah ini tentang penemuan kausal .
Jawaban:
Secara matematis, model kausal terdiri dari hubungan fungsional antar variabel. Misalnya, pertimbangkan sistem persamaan struktural di bawah ini:
Ini berarti bahwax fungsional menentukan nilai y (jika Anda mengintervensi x ini mengubah nilai y ) tetapi tidak sebaliknya. Secara grafis, ini biasanya diwakili oleh x→y , yang berarti x memasuki persamaan struktural y. Sebagai tambahan, Anda juga dapat mengekspresikan model sebab akibat dalam hal distribusi bersama variabel kontrafaktual, yang secara matematis setara dengan model fungsional .
Terkadang (atau sebagian besar waktu) Anda tidak memiliki pengetahuan tentang bentuk persamaan strukturalfx , fy , atau bahkan apakah x→y atau y→x . Satu-satunya informasi yang Anda miliki adalah distribusi probabilitas gabungan p(y,x) (atau sampel dari distribusi ini).
Ini mengarah ke pertanyaan Anda: kapan saya bisa memulihkan arah kausalitas hanya dari data? Atau, lebih tepatnya, kapan saya bisa memulihkan apakahx memasuki persamaan struktural y atau sebaliknya, hanya dari data?
Tentu saja, tanpa asumsi mendasar yang tidak dapat diuji tentang model sebab akibat, ini tidak mungkin . Masalahnya adalah bahwa beberapa model kausal yang berbeda dapat memerlukan distribusi probabilitas gabungan yang sama dari variabel yang diamati. Contoh paling umum adalah sistem linear kausal dengan noise gaussian.
Tetapi di bawah beberapa asumsi kausal, ini mungkin terjadi --- dan inilah yang dilakukan literatur penemuan kausal. Jika Anda tidak memiliki paparan sebelumnya untuk topik ini, Anda mungkin ingin mulai dari Elemen Inferensial Kausal oleh Peters, Janzing dan Scholkopf, serta bab 2 dari Kausalitas oleh Judea Pearl. Kami memiliki topik di sini di CV untuk referensi tentang penemuan kausal , tetapi kami belum memiliki banyak referensi yang terdaftar di sana.
Karena itu, tidak hanya ada satu jawaban untuk pertanyaan Anda, karena itu tergantung pada asumsi yang dibuatnya. Makalah yang Anda sebutkan mengutip beberapa contoh, seperti mengasumsikan model linier dengan noise non-gaussian . Kasus ini dikenal sebagai LINGAN (kependekan dari model asiklik non-gaussian linier), berikut adalah contoh dalam
R
:Perhatikan di sini kita memiliki model kausal linier dengan noise non-gaussian di manax2 menyebabkan x1 dan lingam dengan benar memulihkan arah kausal. Namun, perhatikan ini sangat tergantung pada asumsi LINGAM.
Untuk kasus makalah yang Anda kutip, mereka membuat asumsi khusus ini (lihat "postulat" mereka):
Jikax→y , panjang deskripsi minimal pemetaan mekanisme X ke Y tidak tergantung pada nilai X, sedangkan panjang deskripsi minimal pemetaan mekanisme Y ke X tergantung pada nilai Y.
Perhatikan ini asumsi. Inilah yang kita sebut "kondisi identifikasi" mereka. Pada dasarnya, postulat memberlakukan pembatasan pada distribusi bersamap(x,y) . Yaitu, postulat mengatakan bahwa jika x→y pembatasan tertentu berlaku dalam data, dan jika y→x pembatasan lainnya berlaku. Jenis pembatasan ini yang memiliki implikasi yang dapat diuji (memaksakan batasan pada p(y,x) ) adalah yang memungkinkan seseorang untuk pulih secara terarah dari data pengamatan.
Sebagai ucapan terakhir, hasil penemuan kausal masih sangat terbatas, dan bergantung pada asumsi yang kuat, berhati-hatilah ketika menerapkannya pada konteks dunia nyata.
sumber
lm
). Kita tidak bisa semua bekerja di sekitar sampel pengamatan dataset Tuebingen untuk mendapatkan ide penemuan kausal! :)Ada berbagai pendekatan untuk memformalisasikan kausalitas (yang sesuai dengan pertentangan filosofis substansial tentang kausalitas yang telah ada selama berabad-abad). Yang populer adalah dalam hal hasil potensial. Pendekatan potensi-hasil, yang disebut model kausal Rubin , mengandaikan bahwa untuk setiap keadaan sebab akibat, ada variabel acak yang berbeda. Jadi,Y1 mungkin variabel acak hasil yang mungkin dari percobaan klinis jika subjek mengambil obat studi, dan Y2 mungkin variabel acak jika ia mengambil plasebo. Efek sebab akibat adalah perbedaan antara Y1 dan Y2 . Jika sebenarnya Y1=Y2 , kita dapat mengatakan bahwa pengobatannya tidak berpengaruh. Kalau tidak, kita dapat mengatakan bahwa kondisi perawatan menyebabkan hasilnya.
Hubungan kausal antara variabel juga dapat diwakili dengan grafik asylical directional , yang memiliki rasa yang sangat berbeda tetapi ternyata secara matematis setara dengan model Rubin (Wasserman, 2004, bagian 17.8).
Wasserman, L. (2004). Semua statistik: Kursus singkat dalam inferensi statistik . New York, NY: Springer. ISBN 978-0-387-40272-7.
sumber
There are two ways to determine whetherX is the cause of Y . The first is standard while the second is my own claim.
An intervention is a surgical change to a variable that does not affect variables it depends on. Interventions have been formalized rigorously in structural equations and causal graphical models, but as far as I know, there is no definition which is independent of a particular model class.
To make this rigorous requires formalizing a model overX and Y , and in particular the semantics which define how it is simulated.
In modern approaches to causation, intervention is taken as the primitive object which defines causal relationships (definition 1). In my opinion, however, intervention is a reflection of, and necessarily consistent with simulation dynamics.
sumber