Biarkan dan menjadi variabel acak. adalah mean bersyarat dari diberikan . Kami mengatakan tidak terkait dengan jika tidak bergantung pada , yang berarti sama dengan . Sekarang, mari kita ikuti definisi kausalitas ini sebentar. Menurut hukum ekspektasi berulang, . Ini berarti bahwa jika tidak bergantung pada , jika itu sama dengan , maka .
Dengan kata lain:
Jika dan tidak terkait secara kausal, maka dan tidak berkorelasi! - Ini tidak masuk akal dan saya tahu ini pasti salah. Apakah saya salah mendefinisikan kausalitas? Apa yang telah saya lakukan salah?
Dalam ekonometrika, kita biasanya mengasumsikan . Jadi setara dengan . Logikanya juga berlaku dalam skenario khusus ini.
Jawaban:
Anda salah mendefinisikan kausalitas, ya. Mungkin, Anda telah mendengar ungkapan "korelasi bukan sebab-akibat." Anda pada dasarnya mendefinisikan kausalitas sebagai korelasi. Masalahnya lebih buruk dari itu. Kausalitas bukanlah konsep statistik atau probabilistik sama sekali, setidaknya karena topik-topik tersebut biasanya diajarkan. Tidak ada definisi statistik atau probabilitas kausalitas: tidak ada yang melibatkan ekspektasi kondisional atau distribusi kondisional atau semacamnya. Sulit untuk mengambil fakta ini dari kursus statistik atau ekonometrika.
Sayangnya, kita cenderung melakukan pekerjaan yang lebih baik dengan mengatakan kausalitas bukan dari kausalitas. Kausalitas selalu dan di mana-mana berasal dari teori, dari alasan apriori, dari asumsi. Anda menyebutkan ekonometrik. Jika Anda telah diajarkan variabel instrumental secara kompeten, maka Anda tahu bahwa efek kausal hanya dapat diukur jika Anda memiliki "pembatasan pengecualian." Dan Anda tahu bahwa pembatasan eksklusi selalu berasal dari teori.
Tapi kamu bilang kamu ingin matematika. Orang yang ingin Anda baca adalah Judea Pearl . Ini bukan matematika yang mudah, dan matematika kadang-kadang mengembara ke dalam filsafat, tetapi itu karena kausalitas adalah subjek yang sulit. Ini adalah halaman dengan lebih banyak tautan pada subjek. Ini adalah buku online gratis yang baru saya temui. Akhirnya, inilah pertanyaan sebelumnya di mana saya memberikan jawaban yang mungkin berguna bagi Anda.
sumber
Ini salah. Hubungan sebab akibat adalah tentang dependensi fungsional / struktural, bukan dependensi statistik / asosiasional. Anda harus melihatnya di sini.
Ya, Anda salah mendefinisikannya, Anda dapat memeriksa buku inferensial kausal / referensi di sini . Lebih formal, dalam model persamaan struktural efek kausal pada distribusi , yang dapat kita tunjukkan dengan --- yaitu, bagaimana mengubah mempengaruhi distribusi - - didefinisikan secara matematis sebagai distribusi probabilitas yang diinduksi oleh model persamaan struktural yang dimodifikasi di mana persamaan untuk disubstitusi untuk .X Y P(Y|do(X=x)) X Y X X=x
Misalnya, anggaplah model kausal Anda didefinisikan oleh persamaan struktural berikut:
Dimana gangguan tersebut saling independen dan memiliki beberapa distribusi probabilitas. Ini sesuai dengan DAG:
Maka adalah distribusi probabilitas diinduksi oleh persamaan struktural yang dimodifikasi:P(Y|do(X=x)) Y
Yang sesuai dengan DAG yang dimutilasi:
Efek kausal rata-rata hanyalah ekspektasi menggunakan kausal cdf .Y P(Y|do(X=x))
Ini adalah definisi matematis, apakah Anda dapat mengidentifikasi efek dengan data pengamatan tergantung pada apakah Anda dapat mengekspresikan kembali dalam hal distribusi pengamatan tanpa operator .P(Y|do(X=x)) do()
sumber
Contoh Balik
Masalahnya tampaknya tidak berarti independensi (kondisi di mana ) menyiratkan bahwa dan tidak berkorelasi. Jika dan tidak berkorelasi, secara umum tidak benar bahwa mereka berarti independen. Jadi sejauh ini sepertinya tidak bermasalah.E[Y|X]=E[Y] Y X X Y
Namun, misalkan Anda memiliki hubungan (kita dapat menyebutnya kausal) didefinisikan sebagai , di mana didistribusikan dengan distribusi normal standar dan didistribusikan dengan distribusi Rademacher sehingga atau , masing-masing dengan probabilitas ( lihat artikel Wikipedia ini ). Kemudian perhatikan bahwa . Di bawah definisi Anda, hubungan ini tidak akan causa meskipun jelas tergantung pada .Y=WX X W W=1 −1 1/2 E[Y|X]=E[Y] Y X
Contoh Cara Berpikir Formal Tentang Kausalitas
Untuk memberi Anda mungkin cara yang lebih jelas dan lebih matematis untuk melihat kausalitas, ambil contoh berikut. (Saya meminjam contoh ini dari buku "Mostly Harmless Econometrics.") Misalkan Anda ingin menganalisis efek rawat inap terhadap kesehatan. Tentukan sebagai ukuran kesehatan individu dan untuk menunjukkan apakah individu tersebut dirawat di rumah sakit atau tidak. Dalam upaya pertama kami, anggaplah kita melihat perbedaan rata-rata kesehatan kedua jenis individu:Yi i Di∈{0,1}
Tetapkan hasil potensial dari setiap individu sebagai berikut: adalah kesehatan individu jika dia tidak pergi ke rumah sakit, terlepas dari apakah dia benar-benar pergi atau tidak (kami ingin memikirkan kontrafaktual) dan dengan cara yang sama, adalah kesehatan individu adalah dia memang pergi. Sekarang, tulis hasil yang diamati sebenarnya dalam hal potensi, Jadi, . Sekarang, kita dapat mendefinisikan efek kausal sebagai
sumber
Saya telah memeriksa bukti Anda, dan saya pikir itu benar (setidaknya, saya memeriksa semua langkah untuk definisi diskrit ). Jika , maka . Juga, ini bekerja sebaliknya.E() E(Y|X)=E(Y) E(X⋅Y)=E(X)⋅E(Y)
Namun, saya tidak melihat di mana masalah Anda?
Contoh: pertimbangkan tabel berikut:
Nilainya adalah probabilitas, yaitu dll. Probabilitas marjinal untuk Y adalah 0,25, 0,5, 0,25, dan 0,5 dan 0,5 untuk X.P(X=1∧Y=0)=0.5
Mudah untuk melihat bahwa dan dan oleh karena itu , oleh karena itu menurut definisi Anda variabel tidak berhubungan secara kausal.E(Y)=E(X)=E(X⋅Y)=0 E(Y|X=−1)=E(Y|X=1)=0 E(Y|X)=E(X)
Kovarians adalah nol karena .E(X⋅Y)=E(X)⋅E(Y)
Namun, dua variabel tidak independen, karena .P(X=1∧Y=0)=0.5≠0.5⋅0.5=P(X=1)⋅P(Y=0)
sumber