Masalah dalam Kausalitas dari Buku Mutiara Judea

12

Saya mulai membaca Inferensial Kausal dalam Statistik, A Primer oleh Judea Pearl et. Al. Saya memiliki master dalam matematika, tetapi saya tidak pernah mengambil kursus statistik. Saya agak bingung dengan salah satu pertanyaan studi awal, dan tidak ada yang bisa saya tanyakan tentang hal itu, jadi saya berharap seseorang di situs ini akan mengkritik jawaban saya untuk saya. (Ini bukan masalah pekerjaan rumah. Saya seorang pensiunan, hanya membuat pikiran saya tetap aktif.) Perhatikan bahwa tidak ada data khusus yang diberikan dalam masalah.

a) Ada dua perawatan untuk batu ginjal, Perawatan A dan Perawatan B. Dokter lebih cenderung meresepkan Pengobatan A pada batu besar (dan karena itu lebih parah) dan lebih mungkin meresepkan Pengobatan B pada batu kecil. Haruskah seorang pasien yang tidak mengetahui ukuran batunya memeriksa data populasi umum, atau data ukuran spesifik ketika menentukan perawatan mana yang akan lebih efektif?

b) Ada dua dokter di kota kecil. Masing-masing telah melakukan 100 operasi dalam karirnya, yang terdiri dari dua jenis: satu operasi sangat mudah dan satu operasi sangat sulit. Dokter pertama melakukan operasi mudah lebih sering daripada operasi sulit dan yang kedua melakukan operasi sulit lebih sering daripada operasi mudah. Anda perlu operasi, tetapi Anda tidak tahu apakah kasus Anda mudah atau sulit. Haruskah Anda berkonsultasi dengan tingkat keberhasilan setiap dokter dalam semua kasus, atau haruskah Anda berkonsultasi dengan tingkat keberhasilan untuk kasus-kasus yang mudah dan sulit secara terpisah, untuk memaksimalkan peluang operasi yang berhasil?

Untuk bagian a) masuk akal untuk menduga bahwa ada kekurangan pada Pengobatan A dibandingkan dengan Pengobatan B, atau mengapa tidak diresepkan sepanjang waktu? Jadi, bagi saya tampaknya saya tidak dapat membuat keputusan yang cerdas tanpa mengetahui ukuran batu ginjal saya. Saya berharap data menunjukkan Perlakuan A lebih efektif pada batu besar, dan setidaknya sama efektif pada batu kecil, tetapi saya tidak ingin menganggap risiko yang diduga berasal dari Pengobatan A jika batu saya kecil. Dengan anggapan bahwa batu kecil hampir selalu dapat diobati dengan sukses, saya berharap Pengobatan B menunjukkan tingkat keberhasilan yang lebih tinggi pada populasi umum, tetapi saya tidak ingin mengadopsi Pengobatan B jika saya memiliki batu besar.

Sepertinya saya bahwa data tidak berguna kecuali saya tahu ukuran batu saya. Apakah ini jawaban untuk pertanyaan, mungkin? Semuanya tampak agak sia-sia, karena saya tidak bisa pergi ke apotek dan membeli perawatan baik tanpa resep. Dokter saya akan meresepkannya, dan jika dia tidak bisa (atau tidak mau) memberi tahu saya ukuran batunya, saya akan mengganti dokter.

Adapun bagian b) jelas bahwa Anda ingin melihat tarif untuk prosedur secara terpisah, tetapi tarif saja tidak cukup. Misalkan dokter pertama telah melakukan operasi yang sulit sekali saja, dengan hasil yang sukses, dan dokter kedua telah melakukan 37 kali, dengan 35 keberhasilan. Saya akan sangat cenderung untuk pergi dengan dokter kedua, tetapi saya ingin bagaimana 35 dari 37 dibandingkan dengan norma-norma nasional, dan juga jika 2 kegagalan terjadi di awal karirnya (saat dia masih belajar) atau lebih baru ( setelah dia mulai minum banyak).

Apakah diskusi seperti ini yang disebut masalah, atau apakah jawaban yang lebih kering dan kering diharapkan? Jika saya cukup beruntung memiliki instruktur membaca ini, bagaimana Anda menilai jawaban saya?

Saulspatz
sumber

Jawaban:

9

Pertama izinkan saya mengatakan bahwa jika saya menilai pertanyaan Anda, saya akan memberi Anda nilai yang sangat baik. Ini adalah pertanyaan pengantar buku ini, jadi Anda masih belum memiliki semua alat untuk memikirkan masalahnya, tetapi Anda sudah menunjukkan bahwa Anda tahu Anda perlu mempertimbangkan informasi sebab akibat untuk menjawabnya.

Sekarang untuk jawabannya, perhatikan pertanyaan yang menanyakan apakah Anda ingin melihat data agregat atau data terpisah. Ternyata dalam kedua kasus Anda ingin melihat data yang dipisahkan.

Dalam pertanyaan A, ukuran batu mempengaruhi pilihan perawatan dan status kesehatan. Oleh karena itu, Anda memerlukan data terpisah untuk menghilangkan bias ini dan menentukan perawatan mana yang lebih efektif, baik secara kondisional maupun tanpa syarat. Untuk mengetahui perawatan mana yang lebih baik tanpa syarat, Anda perlu data terpisah untuk mendapatkan efek kausal rata-rata yang ditimbang dengan probabilitas ukuran batu.P(Y=1|do(T))=SP(Y=1|T,S)P(S)P(Y=1|T)dimana Y adalah status kesehatan, T pilihan perawatan dan Sukuran batu. Jika Anda ingin tahu perawatan mana yang lebih baik secara kondisional, maka jelas Anda juga perlu tabel terpisah.

Jika aneh berpikir untuk memilih perawatan untuk diri sendiri tanpa mengetahui ukuran batu, mungkin akan lebih mudah untuk memahami pertanyaan analog dari harus memilih hanya satu perawatan untuk seluruh populasi (katakanlah untuk alasan teknis / anggaran Anda tidak dapat memilih kedua). Dalam hal ini Anda ingin tahu mana yang memiliki efek pengobatan rata-rata terbesar pada populasi secara keseluruhan.

Pertanyaan B adalah masalah yang sama, kesulitan adalah perancu sehingga Anda perlu tabel terpisah untuk mengetahui dokter mana yang lebih baik, baik secara kondisional maupun tanpa syarat. Poin Anda tentang ukuran sampel benar-benar valid, dalam kehidupan nyata Anda harus selalu mempertimbangkan ketidakpastian sampel --- tetapi perhatikan itu tidak mengubah fakta bahwa Anda masih akan membutuhkan informasi dari data yang dipisahkan.

Mengenai komentar terakhir Anda,

jika 2 kegagalan terjadi di awal karirnya (saat dia masih belajar) atau lebih baru (setelah dia mulai banyak minum).

Ini sebenarnya menyentuh masalah yang mendalam dalam inferensi kausal, yang merupakan asumsi invarian . Ambil contoh kasus di mana dokter mulai minum banyak sekarang. Dalam hal ini, data sebelum dan sesudah peristiwa itu tidak berasal dari model kausal yang sama --- jadi Anda sebenarnya membutuhkan lebih banyak informasi dan asumsi kausal untuk membuat kesimpulan dalam kasus ini.

Carlos Cinelli
sumber
2
Terima kasih. Komentar Anda tentang masalah pertama sangat klarifikasi.
saulspatz
3

Saya telah membaca Pearl's Causality , 2nd ed (2009) tetapi bukan Primer yang Anda rujuk di sini. Anda tampaknya mendekati pertanyaan-pertanyaan studi ini dengan mentalitas yang tepat. Anda memunculkan pengetahuan latar belakang Anda sendiri untuk mengisi skenario ini dengan informasi kausal penting . Anda juga secara langsung menyerang apa yang menurut saya agak menyimpang dari masalah keputusan yang disajikan, dan berusaha keras untuk menggantinya dengan masalah yang lebih bermakna dan realistis.

David C. Norris
sumber
2
+1 untuk frasa "kesombongan yang cukup menyimpang." Tentu saja masalah buku teks tidak pernah sepenuhnya realistis, untuk alasan yang jelas, tetapi tidak jelas bagi saya seberapa realistis hal ini seharusnya. Saya kira semuanya akan menjadi lebih jelas ketika saya terus membaca.
saulspatz