Dari perspektif statistik, dapatkah seseorang menyimpulkan kausalitas menggunakan skor kecenderungan dengan studi observasional?

27

Pertanyaan: Dari sudut pandang ahli statistik (atau seorang praktisi), dapatkah seseorang menyimpulkan kausalitas menggunakan skor kecenderungan dengan studi observasional ( bukan eksperimen )?

Tolong, tidak ingin memulai perang api atau debat fanatik.

Latar belakang: Dalam program stat PhD kami, kami hanya menyentuh inferensi kausal melalui kelompok kerja dan beberapa sesi topik. Namun, ada beberapa peneliti yang sangat menonjol di departemen lain (misalnya HDFS, Sosiologi) yang secara aktif menggunakannya.

Saya sudah menyaksikan beberapa perdebatan yang cukup memanas tentang masalah ini. Bukan niat saya untuk memulainya di sini. Yang mengatakan, referensi apa yang Anda temui? Apa sudut pandang yang Anda miliki? Sebagai contoh, satu argumen yang saya dengar terhadap skor kecenderungan sebagai teknik inferensial kausal adalah bahwa seseorang tidak pernah dapat menyimpulkan kausalitas karena bias variabel yang dihilangkan - jika Anda meninggalkan sesuatu yang penting, Anda memutus rantai kausal. Apakah ini masalah yang tidak bisa diselesaikan?

Penafian: Pertanyaan ini mungkin tidak memiliki jawaban yang benar - benar-benar keren dengan mengklik cw, tapi saya pribadi sangat tertarik dengan tanggapan dan akan senang dengan beberapa referensi bagus yang mencakup contoh dunia nyata.

M. Tibbits
sumber

Jawaban:

16

Pada awal artikel yang bertujuan mempromosikan penggunaan PS dalam epidemiologi, Oakes dan Gereja (1) mengutip klaim Hernán dan Robins tentang efek pengganggu dalam epidemiologi (2):

Bisakah Anda menjamin bahwa hasil dari penelitian observasional Anda tidak terpengaruh oleh perancu yang tidak terukur? Satu-satunya jawaban yang dapat diberikan oleh ahli epidemiologi adalah 'tidak'.

Ini bukan hanya untuk mengatakan bahwa kami tidak dapat memastikan bahwa hasil dari studi pengamatan tidak bias atau tidak berguna (karena, seperti @propofol katakan, hasilnya dapat berguna untuk merancang RCT), tetapi juga bahwa PS tentu saja tidak menawarkan solusi lengkap untuk ini masalah, atau setidaknya tidak selalu menghasilkan hasil yang lebih baik daripada metode pencocokan atau multivariat lainnya (lihat misalnya (10)).

Skor kecenderungan (PS), oleh konstruksi, probabilistik bukan indikator kausal . Pilihan kovariat yang memasuki fungsi skor kecenderungan adalah elemen kunci untuk memastikan keandalannya, dan kelemahan mereka, seperti yang telah dikatakan, terutama berdiri dari tidak mengendalikan perancu yang tidak teramati (yang sangat mungkin dalam studi retrospektif atau case-control ) . Faktor-faktor lain harus dipertimbangkan: (a) model kesalahan spesifikasi akan memengaruhi estimasi efek langsung (tidak benar-benar lebih banyak daripada dalam kasus OLS), (b) mungkin ada data yang hilang pada tingkat kovariat, (c) PSs melakukan tidak mengatasi efek sinergis yang diketahui mempengaruhi interpretasi kausal (8,9).

Adapun referensi, saya menemukan slide Roger Newson - kausalitas, pembaur, dan skor kecenderungan - relatif seimbang dengan baik tentang pro dan kontra menggunakan skor kecenderungan, dengan ilustrasi dari studi nyata. Ada juga beberapa makalah yang baik membahas penggunaan skor kecenderungan dalam studi pengamatan atau epidemiologi lingkungan dua tahun lalu di Statistics in Medicine, dan saya lampirkan beberapa di bagian akhir (3-6). Tapi saya suka review Pearl (7) karena ia menawarkan perspektif yang lebih besar tentang masalah kausalitas (PS dibahas pada hal. 117 dan 130). Jelas, Anda akan menemukan lebih banyak ilustrasi dengan melihat penelitian terapan. Saya ingin menambahkan dua artikel terbaru dari William R Shadish yang datang di situs web Andrew Gelman (11,12). Penggunaan skor kecenderungan dibahas, tetapi dua makalah ini lebih banyak berfokus pada inferensial kausal dalam studi observasional (dan bagaimana hal itu dibandingkan dengan pengaturan acak).

Referensi

  1. Oakes, JM and Church, TR (2007). Diundang Komentar: Memajukan Metode Skor Kecenderungan dalam Epidemiologi . American Journal of Epidemiology , 165 (10), 1119-1121.
  2. Hernan MA dan Robins JM (2006). Instrumen untuk inferensi kausal: mimpi epidemiologis? Epidemiologi , 17, 360-72.
  3. Rubin, D. (2007). Desain versus analisis studi observasional untuk efek kausal: Paralel dengan desain uji acak . Statistik dalam Kedokteran , 26, 20-36.
  4. Shrier, I. (2008). Surat kepada editor . Statistik dalam Kedokteran , 27, 2740–2741
  5. Pearl, J. (2009). Keterangan tentang metode skor kecenderungan . Statistik dalam Kedokteran , 28, 1415–1424.
  6. Stuart, EA (2008). Mengembangkan rekomendasi praktis untuk penggunaan skor kecenderungan: Diskusi 'Penilaian kritis pencocokan skor kecenderungan dalam literatur medis antara tahun 1996 dan 2003' oleh Peter Austin . Statistik dalam Kedokteran , 27, 2062-2065.
  7. Pearl, J. (2009). Inferensial kausal dalam statistik: Tinjauan umum . Survei Statistik , 3, 96-146.
  8. Oakes, JM dan Johnson, PJ (2006). Pencocokan skor kecenderungan untuk epidemiologi sosial . Dalam Metode dalam Epidemiologi Sosial , JM Oakes dan S. Kaufman (Eds.), Hlm. 364-386. Jossez-Bass.
  9. Höfler, M (2005). Inferensi kausal berdasarkan kontrafaktual . Metodologi Penelitian Medis BMC , 5, 28.
  10. Winkelmayer, WC dan Kurth, T. (2004). Skor kecenderungan: bantuan atau promosi? Transplantasi Dialisis Nefrologi , 19 (7), 1671-1673.
  11. Shadish, WR, Clark, MH, dan Steiner, PM (2008). Bisakah Eksperimen Nonrandom Menghasilkan Jawaban yang Akurat? Eksperimen Acak Membandingkan Penugasan Acak dan Nonrandom . JASA , 103 (484), 1334-1356.
  12. Masak, TD, Shadish, WR, dan Wong, VC (2008). Tiga Kondisi di mana Eksperimen dan Studi Observasi Menghasilkan Estimasi Kausal Yang Sebanding: Temuan Baru dari Perbandingan Dalam Studi . Jurnal Analisis dan Manajemen Kebijakan , 27 (4), 724-750.
chl
sumber
11

Skor kecenderungan biasanya digunakan dalam literatur yang cocok. Skor kecenderungan menggunakan kovariat pra-perawatan untuk memperkirakan kemungkinan menerima pengobatan. Pada dasarnya, regresi (baik OLS biasa atau logit, probit, dll) digunakan untuk menghitung skor kecenderungan dengan pengobatan karena hasil Anda dan variabel pra-perawatan adalah kovariat Anda. Setelah perkiraan yang baik dari skor kecenderungan diperoleh, subyek dengan skor kecenderungan yang sama, tetapi perlakuan yang berbeda diterima, dicocokkan satu sama lain. Efek pengobatan adalah perbedaan rata-rata di antara kedua kelompok ini.

Rosenbaum dan Rubin (1983) menunjukkan bahwa mencocokkan subyek yang diobati dan kontrol yang hanya menggunakan skor kecenderungan sudah cukup untuk menghilangkan semua bias dalam estimasi efek perawatan yang berasal dari kovariat pra-perawatan yang diamati yang digunakan untuk menyusun skor. Perhatikan bahwa bukti ini membutuhkan penggunaan skor kecenderungan sebenarnya, dan bukan perkiraan. Keuntungan dari pendekatan ini adalah mengubah masalah pencocokan dalam berbagai dimensi (satu untuk setiap kovariat pra-perawatan) menjadi kasus pencocokan univariat --- penyederhanaan yang hebat.

Rosenbaum, Paul R. dan Donald B. Rubin. 1983. " Peran Sentral Skor Kecenderungan dalam Studi Observasional untuk Efek Kausal ." Biometrika. 70 (1): 41--55.

Charlie
sumber
8

Hanya percobaan acak prospektif yang dapat menentukan hubungan sebab akibat. Dalam studi observasional, akan selalu ada kemungkinan kovariat yang tidak terukur atau tidak diketahui yang membuat menganggap kausalitas menjadi mustahil.

Namun, percobaan observasional dapat memberikan bukti hubungan yang kuat antara x dan y, dan karenanya berguna untuk pembuatan hipotesis. Hipotesis ini kemudian perlu dikonfirmasi dengan uji coba secara acak.

pmgjones
sumber
Saya sangat setuju dengan Anda. Sebuah studi observasional mungkin baik untuk mengungkap beberapa asosiasi yang pada gilirannya seseorang dapat menguji menggunakan kerangka kerja yang jauh lebih ketat (uji coba secara acak seperti yang Anda sarankan).
Sympa
Ekspresi yang rapi. Tidak bisa lebih setuju dengan Anda dengan kata, asosiasi 'kuat' antara x dan y.
Kevin Kang
7

Pertanyaan itu tampaknya melibatkan dua hal yang benar-benar harus dipertimbangkan secara terpisah. Pertama adalah apakah seseorang dapat menyimpulkan hubungan sebab akibat dari studi observasional, dan pada itu Anda mungkin kontras pandangan, katakanlah, Pearl (2009), yang berpendapat ya selama Anda dapat memodelkan proses dengan benar, versus pandangan @ propofol, siapa yang akan menemukan banyak sekutu dalam disiplin eksperimental dan yang mungkin berbagi beberapa pemikiran yang diungkapkan dalam esai (yang agak tidak jelas tetapi baik) oleh Gerber et al (2004). Kedua, dengan asumsi bahwa Anda memang berpikir bahwa kausalitas dapat disimpulkan dari data pengamatan, Anda mungkin bertanya-tanya apakah metode skor kecenderungan berguna dalam melakukannya. Metode skor kecenderungan meliputi berbagai strategi pengkondisian serta pembobotan kecenderungan terbalik. Ulasan yang bagus diberikan oleh Lunceford dan Davidian (2004).

Sedikit kerut: pencocokan skor kecenderungan dan pembobotan juga digunakan dalam analisis eksperimen acak ketika, misalnya, ada minat dalam menghitung "efek tidak langsung" dan juga ketika ada masalah yang berpotensi gesekan atau putus secara tidak acak ( dalam hal ini apa yang Anda miliki menyerupai studi observasional).

Referensi

Gerber A, dkk. 2004. "Ilusi belajar dari penelitian observasional." Dalam Shapiro I, et al, Masalah dan Metode dalam Studi Politik , Cambridge University Press.

Lunceford JK, Davidian M. 2004. "Stratifikasi dan pembobotan melalui skor kecenderungan dalam estimasi efek pengobatan kausal: studi banding." Statistik dalam Kedokteran 23 (19): 2937–2960.

Pearl J. 2009. Kausalitas (2nd Ed.) , Cambridge University Press.

Cyrus S
sumber
Bagusnya Anda mengutip seluruh buku dari Pearl.
chl
0

Kearifan konvensional menyatakan bahwa hanya uji coba terkontrol secara acak (percobaan "nyata") yang dapat mengidentifikasi hubungan sebab akibat.

Namun, tidak sesederhana itu.

Salah satu alasan bahwa pengacakan mungkin tidak cukup adalah bahwa dalam sampel "kecil" hukum jumlah besar tidak "cukup kuat" untuk memastikan bahwa masing - masing dan semua perbedaan seimbang. Pertanyaannya adalah: apa itu "terlalu kecil" dan kapan mulai "cukup besar"? Saint-Mont (2015) berpendapat di sini bahwa "cukup besar" mungkin dimulai dalam ribuan (n> 1000)!

Bagaimanapun, intinya adalah untuk menyeimbangkan perbedaan antar kelompok, untuk mengontrol perbedaan. Jadi, bahkan dalam percobaan, perhatian besar harus diberikan untuk menyeimbangkan perbedaan antar kelompok. Menurut kalkulasi Saint-Mont (2015), mungkin saja dalam sampel yang lebih kecil seseorang dapat jauh lebih baik dengan sampel yang cocok (seimbang secara manual).

Untuk probabilitas. Tentu saja, probabilitas tidak pernah mampu memberikan jawaban konklusif - kecuali probabilitasnya ekstrem (nol atau satu). Namun, dalam sains, kami mendapati diri kami sering dihadapkan pada situasi jika kami tidak dapat memberikan jawaban konklusif karena hal-hal sulit. Maka dari itu kebutuhan akan probabilitas. Probabilitas tidak lebih dari cara untuk mengekspresikan ketidakpastian kita dalam sebuah pernyataan. Dengan demikian, ini mirip dengan logika; lihat Briggs (2016) di sini .

Jadi, probabilitas akan membantu kita tetapi tidak akan memberikan jawaban konklusif, tidak ada kepastian. Tapi ini sangat berguna - untuk mengekspresikan ketidakpastian.

Perhatikan juga bahwa kausalitas bukan terutama pertanyaan statistik. Misalkan dua cara berbeda "signifikan". Apakah tidak berarti variabel pengelompokan adalah penyebab perbedaan dalam variabel yang diukur? Tidak (belum tentu). Tidak peduli statistik mana yang digunakan seseorang - skor kecenderungan, nilai-p, Faktor Bayes dan sebagainya - metode tersebut (secara praktis) tidak pernah cukup untuk mendukung klaim kausal.

Sebastian Sauer
sumber