Bagaimana hubungan sebab akibat didefinisikan secara matematis?

Apa definisi matematis dari hubungan sebab akibat antara dua variabel acak?

Diberikan sampel dari distribusi bersama dua variabel acak $X$ dan $Y$ , kapan kita mengatakan $X$ menyebabkan $Y$ ?

Untuk konteks, saya membaca makalah ini tentang penemuan kausal .

machine-learning causality Jane
sumber

Sejauh yang saya bisa lihat kausalitas adalah konsep ilmiah bukan matematika. Bisakah Anda mengedit untuk menjelaskan?

mdewey

@mewey saya tidak setuju. Kausalitas dapat dicairkan sepenuhnya secara formal. Lihat misalnya jawaban saya.

Kodiologis

Jawaban:

Apa definisi matematis dari hubungan sebab akibat antara dua variabel acak?

Secara matematis, model kausal terdiri dari hubungan fungsional antar variabel. Misalnya, pertimbangkan sistem persamaan struktural di bawah ini:

x = f_{x} (ϵ_{x}) y = f_{y} (x, ϵ_{y})

$x = f_x(\epsilon_{x})\\ y = f_y(x, \epsilon_{y})$

Ini berarti bahwa $x$ fungsional menentukan nilai $y$ (jika Anda mengintervensi $x$ ini mengubah nilai $y$ ) tetapi tidak sebaliknya. Secara grafis, ini biasanya diwakili oleh $x \rightarrow y$ , yang berarti $x$ memasuki persamaan struktural y. Sebagai tambahan, Anda juga dapat mengekspresikan model sebab akibat dalam hal distribusi bersama variabel kontrafaktual, yang secara matematis setara dengan model fungsional .

Diberikan sampel dari distribusi bersama dua variabel acak X dan Y, kapan kita mengatakan X menyebabkan Y?

Terkadang (atau sebagian besar waktu) Anda tidak memiliki pengetahuan tentang bentuk persamaan struktural $f_{x}$ , $f_y$ , atau bahkan apakah $x\rightarrow y$ atau $y \rightarrow x$ . Satu-satunya informasi yang Anda miliki adalah distribusi probabilitas gabungan $p(y,x)$ (atau sampel dari distribusi ini).

Ini mengarah ke pertanyaan Anda: kapan saya bisa memulihkan arah kausalitas hanya dari data? Atau, lebih tepatnya, kapan saya bisa memulihkan apakah $x$ memasuki persamaan struktural $y$ atau sebaliknya, hanya dari data?

Tentu saja, tanpa asumsi mendasar yang tidak dapat diuji tentang model sebab akibat, ini tidak mungkin . Masalahnya adalah bahwa beberapa model kausal yang berbeda dapat memerlukan distribusi probabilitas gabungan yang sama dari variabel yang diamati. Contoh paling umum adalah sistem linear kausal dengan noise gaussian.

Tetapi di bawah beberapa asumsi kausal, ini mungkin terjadi --- dan inilah yang dilakukan literatur penemuan kausal. Jika Anda tidak memiliki paparan sebelumnya untuk topik ini, Anda mungkin ingin mulai dari Elemen Inferensial Kausal oleh Peters, Janzing dan Scholkopf, serta bab 2 dari Kausalitas oleh Judea Pearl. Kami memiliki topik di sini di CV untuk referensi tentang penemuan kausal , tetapi kami belum memiliki banyak referensi yang terdaftar di sana.

Karena itu, tidak hanya ada satu jawaban untuk pertanyaan Anda, karena itu tergantung pada asumsi yang dibuatnya. Makalah yang Anda sebutkan mengutip beberapa contoh, seperti mengasumsikan model linier dengan noise non-gaussian . Kasus ini dikenal sebagai LINGAN (kependekan dari model asiklik non-gaussian linier), berikut adalah contoh dalam R:

library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1

# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat") 

# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
#     [,1]  [,2]
# [1,] .     .   
# [2,]  TRUE .

Perhatikan di sini kita memiliki model kausal linier dengan noise non-gaussian di mana $x_2$ menyebabkan $x_1$ dan lingam dengan benar memulihkan arah kausal. Namun, perhatikan ini sangat tergantung pada asumsi LINGAM.

Untuk kasus makalah yang Anda kutip, mereka membuat asumsi khusus ini (lihat "postulat" mereka):

Jika $x\rightarrow y$ , panjang deskripsi minimal pemetaan mekanisme X ke Y tidak tergantung pada nilai X, sedangkan panjang deskripsi minimal pemetaan mekanisme Y ke X tergantung pada nilai Y.

Perhatikan ini asumsi. Inilah yang kita sebut "kondisi identifikasi" mereka. Pada dasarnya, postulat memberlakukan pembatasan pada distribusi bersama $p(x,y)$ . Yaitu, postulat mengatakan bahwa jika $x \rightarrow y$ pembatasan tertentu berlaku dalam data, dan jika $y \rightarrow x$ pembatasan lainnya berlaku. Jenis pembatasan ini yang memiliki implikasi yang dapat diuji (memaksakan batasan pada $p(y,x)$ ) adalah yang memungkinkan seseorang untuk pulih secara terarah dari data pengamatan.

Sebagai ucapan terakhir, hasil penemuan kausal masih sangat terbatas, dan bergantung pada asumsi yang kuat, berhati-hatilah ketika menerapkannya pada konteks dunia nyata.

Carlos Cinelli
sumber

Apakah ada kemungkinan Anda menambah jawaban Anda untuk menyertakan beberapa contoh sederhana dengan data palsu ? Misalnya, setelah membaca sedikit Elemen Inferensial Kausal dan melihat beberapa ceramah Peters, dan kerangka kerja regresi biasanya digunakan untuk memotivasi kebutuhan untuk memahami masalah secara detail (Saya bahkan tidak menyentuh pekerjaan ICP mereka). Saya memiliki kesan (mungkin salah) bahwa dalam upaya Anda untuk menjauh dari RCM, jawaban Anda mengabaikan semua mesin pemodelan nyata yang nyata.

usεr11852 mengatakan Reinstate Monic

@ usεr11852 Saya tidak yakin saya mengerti konteks pertanyaan Anda, apakah Anda ingin contoh penemuan kausal? Ada beberapa contoh dalam makalah yang telah disediakan Jane. Juga, saya tidak yakin saya mengerti apa yang Anda maksud dengan "menghindari RCM dan meninggalkan mesin pemodelan nyata yang nyata", mesin nyata apa yang kita lewatkan dalam konteks penemuan sebab akibat di sini?

Carlos Cinelli

Maaf atas kebingungan, saya tidak peduli tentang contoh-contoh dari kertas. Saya bisa mengutip kertas lain sendiri. (Misalnya, Lopez-Paz et al. CVPR 2017 tentang koefisien sebab-akibat saraf mereka) Yang saya pedulikan adalah contoh numerik sederhana dengan data palsu yang dijalankan seseorang di R (atau bahasa favorit Anda) dan lihat apa yang Anda maksud. Jika Anda mengutip contohnya Peters 'et al. buku dan mereka memiliki potongan kode kecil yang sangat membantu (dan kadang-kadang hanya digunakan lm). Kita tidak bisa semua bekerja di sekitar sampel pengamatan dataset Tuebingen untuk mendapatkan ide penemuan kausal! :)

usεr11852 mengatakan Reinstate Monic

@ usεr11852 yakin, termasuk contoh palsu sepele, saya bisa memasukkan satu menggunakan lingam di R. Tapi apakah Anda mau menjelaskan apa yang Anda maksud dengan "menghindari RCM dan meninggalkan mesin pemodelan nyata yang nyata"?

Carlos Cinelli

@ usεr11852 ok terima kasih atas umpan baliknya, saya akan mencoba memasukkan lebih banyak kode bila perlu. Sebagai komentar terakhir, hasil penemuan kausal masih sangat terbatas, sehingga orang harus sangat berhati-hati ketika menerapkan ini tergantung pada konteksnya.

Carlos Cinelli

Ada berbagai pendekatan untuk memformalisasikan kausalitas (yang sesuai dengan pertentangan filosofis substansial tentang kausalitas yang telah ada selama berabad-abad). Yang populer adalah dalam hal hasil potensial. Pendekatan potensi-hasil, yang disebut model kausal Rubin , mengandaikan bahwa untuk setiap keadaan sebab akibat, ada variabel acak yang berbeda. Jadi, $Y_1$ mungkin variabel acak hasil yang mungkin dari percobaan klinis jika subjek mengambil obat studi, dan $Y_2$ mungkin variabel acak jika ia mengambil plasebo. Efek sebab akibat adalah perbedaan antara $Y_1$ dan $Y_2$ . Jika sebenarnya $Y_1 = Y_2$ , kita dapat mengatakan bahwa pengobatannya tidak berpengaruh. Kalau tidak, kita dapat mengatakan bahwa kondisi perawatan menyebabkan hasilnya.

Hubungan kausal antara variabel juga dapat diwakili dengan grafik asylical directional , yang memiliki rasa yang sangat berbeda tetapi ternyata secara matematis setara dengan model Rubin (Wasserman, 2004, bagian 17.8).

Wasserman, L. (2004). Semua statistik: Kursus singkat dalam inferensi statistik . New York, NY: Springer. ISBN 978-0-387-40272-7.

Kodiologis
sumber

Terima kasih. apa yang akan menjadi tes untuk itu diberikan satu set sampel dari distribusi bersama?

Jane

Saya membaca arxiv.org/abs/1804.04622 . Saya belum membaca rujukannya. Saya mencoba memahami apa yang dimaksud dengan kausalitas berdasarkan pada data pengamatan.

Jane

Y_{1}

$Y_1$

Y_{2}

$Y_2$

X

$X$

Y

$Y$

@Vimal: Saya mengerti kasus di mana kami memiliki "distribusi intervensional". Kami tidak memiliki "distribusi intervensi" dalam pengaturan ini dan itulah yang membuatnya lebih sulit untuk dipahami. Dalam contoh yang memotivasi di koran mereka memberikan sesuatu seperti

(x, y = x^{3} + ϵ)

$(x, y=x^3+\epsilon)$ . The conditional distribution of y given x is essentially the distribution of the noise

ϵ

$\epsilon$ plus some translation, while that doesn't hold for the conditional distribution of x given y. I initiatively understand the example. I am trying to understand what is the general definition for observational discovery of causality.

Jane

@Jane for observational case (for your question), in general you cannot infer direction of causality purely mathematically, at least for the two variable case. For more variables, under additional (untestable) assumptions you could make a claim, but the conclusion can still be questioned. This discussion is very long in comments. :)

Vimal

There are two ways to determine whether $X$ is the cause of $Y$ . The first is standard while the second is my own claim.

There exists an intervention on $X$ such that the value of $Y$ is changed

An intervention is a surgical change to a variable that does not affect variables it depends on. Interventions have been formalized rigorously in structural equations and causal graphical models, but as far as I know, there is no definition which is independent of a particular model class.

The simulation of $Y$ requires the simulation of $X$

To make this rigorous requires formalizing a model over $X$ and $Y$ , and in particular the semantics which define how it is simulated.

In modern approaches to causation, intervention is taken as the primitive object which defines causal relationships (definition 1). In my opinion, however, intervention is a reflection of, and necessarily consistent with simulation dynamics.

zenna
sumber