Saat ini saya sedang membaca karya Pearl (Pearl, 2009, 2nd edition) tentang hubungan sebab akibat dan perjuangan untuk membangun hubungan antara identifikasi nonparametrik dari suatu model dan estimasi aktual. Sayangnya, Pearl sendiri sangat diam tentang topik ini.
Untuk memberikan contoh, saya memiliki model sederhana dalam pikiran dengan jalur kausal, , dan perancu yang mempengaruhi semua variabel , dan . Selain itu, dan terkait dengan pengaruh yang tidak teramati, . Menurut aturan do-calculus, saya sekarang tahu bahwa distribusi probabilitas pasca-intervensi (diskrit) diberikan oleh:w → x w → z w → y x y x ← → y
Saya tahu bagaimana saya bisa memperkirakan jumlah ini (non-parametrik atau dengan memperkenalkan asumsi parametrik)? Khusus untuk kasus ketika adalah seperangkat beberapa variabel pengganggu dan jumlah bunga yang kontinu. Untuk memperkirakan distribusi pra-intervensi bersama dari data tampaknya sangat tidak praktis dalam kasus ini. Apakah ada yang tahu aplikasi metode Pearl yang menangani masalah ini? Saya akan sangat senang untuk sebuah pointer.
Jawaban:
Ini pertanyaan yang sangat bagus. Pertama mari kita verifikasi apakah formula Anda benar. Informasi yang Anda berikan sesuai dengan model kausal berikut:
Dan seperti yang telah Anda katakan, kita dapat memperoleh estimasi dan untuk menggunakan aturan do-calculus. Di R kita bisa dengan mudah melakukannya dengan paket . Kami pertama-tama memuat untuk membuat objek dengan diagram sebab akibat yang Anda usulkan:P( Y|dHai ( X) )
causaleffect
igraph
Di mana dua istilah pertamaX Y
X-+Y, Y-+X
mewakili perancu dan tidak teramati dan sisa istilah mewakili tepi terarah yang Anda sebutkan.YKemudian kami meminta estimasi kami:
Yang memang bertepatan dengan formula Anda --- kasus pintu depan dengan perancu yang diamati.
Sekarang mari kita pergi ke bagian estimasi. Jika Anda menganggap linearitas (dan normalitas), banyak hal disederhanakan. Pada dasarnya apa yang ingin Anda lakukan adalah untuk memperkirakan koefisien jalur .X→Z→Y
Mari kita simulasikan beberapa data:
Perhatikan dalam simulasi kami efek kausal sebenarnya dari perubahan pada adalah 21. Anda dapat memperkirakan ini dengan menjalankan dua regresi. Pertama untuk mendapatkan efek dari pada dan kemudian untuk mendapatkan efek dari pada . Perkiraan Anda akan menjadi produk dari kedua koefisien:Y Y ∼ Z + W + X Z Y Z ∼ X + W X ZX Y Y∼Z+W+X Z Y Z∼X+W X Z
Dan untuk kesimpulan Anda dapat menghitung kesalahan standar (asimptotik) dari produk:
Yang dapat Anda gunakan untuk tes atau interval kepercayaan:
Anda juga dapat melakukan estimasi (non / semi) -parametric, saya akan mencoba memperbarui jawaban ini termasuk prosedur lain nanti.
sumber