Pertanyaan: Dari sudut pandang ahli statistik (atau seorang praktisi), dapatkah seseorang menyimpulkan kausalitas menggunakan skor kecenderungan dengan studi observasional ( bukan eksperimen )?
Tolong, tidak ingin memulai perang api atau debat fanatik.
Latar belakang: Dalam program stat PhD kami, kami hanya menyentuh inferensi kausal melalui kelompok kerja dan beberapa sesi topik. Namun, ada beberapa peneliti yang sangat menonjol di departemen lain (misalnya HDFS, Sosiologi) yang secara aktif menggunakannya.
Saya sudah menyaksikan beberapa perdebatan yang cukup memanas tentang masalah ini. Bukan niat saya untuk memulainya di sini. Yang mengatakan, referensi apa yang Anda temui? Apa sudut pandang yang Anda miliki? Sebagai contoh, satu argumen yang saya dengar terhadap skor kecenderungan sebagai teknik inferensial kausal adalah bahwa seseorang tidak pernah dapat menyimpulkan kausalitas karena bias variabel yang dihilangkan - jika Anda meninggalkan sesuatu yang penting, Anda memutus rantai kausal. Apakah ini masalah yang tidak bisa diselesaikan?
Penafian: Pertanyaan ini mungkin tidak memiliki jawaban yang benar - benar-benar keren dengan mengklik cw, tapi saya pribadi sangat tertarik dengan tanggapan dan akan senang dengan beberapa referensi bagus yang mencakup contoh dunia nyata.
sumber
Pertanyaan itu tampaknya melibatkan dua hal yang benar-benar harus dipertimbangkan secara terpisah. Pertama adalah apakah seseorang dapat menyimpulkan hubungan sebab akibat dari studi observasional, dan pada itu Anda mungkin kontras pandangan, katakanlah, Pearl (2009), yang berpendapat ya selama Anda dapat memodelkan proses dengan benar, versus pandangan @ propofol, siapa yang akan menemukan banyak sekutu dalam disiplin eksperimental dan yang mungkin berbagi beberapa pemikiran yang diungkapkan dalam esai (yang agak tidak jelas tetapi baik) oleh Gerber et al (2004). Kedua, dengan asumsi bahwa Anda memang berpikir bahwa kausalitas dapat disimpulkan dari data pengamatan, Anda mungkin bertanya-tanya apakah metode skor kecenderungan berguna dalam melakukannya. Metode skor kecenderungan meliputi berbagai strategi pengkondisian serta pembobotan kecenderungan terbalik. Ulasan yang bagus diberikan oleh Lunceford dan Davidian (2004).
Sedikit kerut: pencocokan skor kecenderungan dan pembobotan juga digunakan dalam analisis eksperimen acak ketika, misalnya, ada minat dalam menghitung "efek tidak langsung" dan juga ketika ada masalah yang berpotensi gesekan atau putus secara tidak acak ( dalam hal ini apa yang Anda miliki menyerupai studi observasional).
Referensi
Gerber A, dkk. 2004. "Ilusi belajar dari penelitian observasional." Dalam Shapiro I, et al, Masalah dan Metode dalam Studi Politik , Cambridge University Press.
Lunceford JK, Davidian M. 2004. "Stratifikasi dan pembobotan melalui skor kecenderungan dalam estimasi efek pengobatan kausal: studi banding." Statistik dalam Kedokteran 23 (19): 2937–2960.
Pearl J. 2009. Kausalitas (2nd Ed.) , Cambridge University Press.
sumber
Kearifan konvensional menyatakan bahwa hanya uji coba terkontrol secara acak (percobaan "nyata") yang dapat mengidentifikasi hubungan sebab akibat.
Namun, tidak sesederhana itu.
Salah satu alasan bahwa pengacakan mungkin tidak cukup adalah bahwa dalam sampel "kecil" hukum jumlah besar tidak "cukup kuat" untuk memastikan bahwa masing - masing dan semua perbedaan seimbang. Pertanyaannya adalah: apa itu "terlalu kecil" dan kapan mulai "cukup besar"? Saint-Mont (2015) berpendapat di sini bahwa "cukup besar" mungkin dimulai dalam ribuan (n> 1000)!
Bagaimanapun, intinya adalah untuk menyeimbangkan perbedaan antar kelompok, untuk mengontrol perbedaan. Jadi, bahkan dalam percobaan, perhatian besar harus diberikan untuk menyeimbangkan perbedaan antar kelompok. Menurut kalkulasi Saint-Mont (2015), mungkin saja dalam sampel yang lebih kecil seseorang dapat jauh lebih baik dengan sampel yang cocok (seimbang secara manual).
Untuk probabilitas. Tentu saja, probabilitas tidak pernah mampu memberikan jawaban konklusif - kecuali probabilitasnya ekstrem (nol atau satu). Namun, dalam sains, kami mendapati diri kami sering dihadapkan pada situasi jika kami tidak dapat memberikan jawaban konklusif karena hal-hal sulit. Maka dari itu kebutuhan akan probabilitas. Probabilitas tidak lebih dari cara untuk mengekspresikan ketidakpastian kita dalam sebuah pernyataan. Dengan demikian, ini mirip dengan logika; lihat Briggs (2016) di sini .
Jadi, probabilitas akan membantu kita tetapi tidak akan memberikan jawaban konklusif, tidak ada kepastian. Tapi ini sangat berguna - untuk mengekspresikan ketidakpastian.
Perhatikan juga bahwa kausalitas bukan terutama pertanyaan statistik. Misalkan dua cara berbeda "signifikan". Apakah tidak berarti variabel pengelompokan adalah penyebab perbedaan dalam variabel yang diukur? Tidak (belum tentu). Tidak peduli statistik mana yang digunakan seseorang - skor kecenderungan, nilai-p, Faktor Bayes dan sebagainya - metode tersebut (secara praktis) tidak pernah cukup untuk mendukung klaim kausal.
sumber