Mengapa pencocokan skor kecenderungan bekerja untuk inferensi kausal?

13

Pencocokan skor kecenderungan digunakan untuk membuat kesimpulan kausal dalam studi observasional (lihat makalah Rosenbaum / Rubin ). Apa intuisi sederhana di balik mengapa ia bekerja?

Dengan kata lain, mengapa jika kita memastikan probabilitas untuk berpartisipasi dalam pengobatan adalah sama untuk kedua kelompok, efek perancu menghilang, dan kita dapat menggunakan hasilnya untuk membuat kesimpulan kausal tentang pengobatan?

maks
sumber
8
Milik saya mungkin pendapat yang tidak populer, tapi saya pikir mengatakan bahwa PSM memungkinkan Anda untuk membuat kesimpulan kausal sedikit melebar. Ya, ini adalah metode pencocokan yang lebih baik dari sekadar pencocokan "kasar" pada beberapa variabel, tetapi pada akhirnya, Anda masih hanya mencocokkan hanya pada variabel-variabel yang dapat diamati oleh Anda. Anda mungkin masih memiliki perawatan endogen, tetapi Anda membuat asumsi bahwa setelah pencocokan, pengobatan eksogen. Tapi sekali lagi, saya bukan siapa-siapa dibandingkan dengan orang-orang seperti Rubin :)
Marquis de Carabas
5
Ada yang tidak setuju dengan Rosenbaum dan Rubin. Gary King berpendapat cukup efektif bahwa hasil dari pencocokan menggunakan PSM lebih rendah daripada hasil yang diperoleh dari pencocokan berdasarkan jarak Mahalanobis. Lihat makalahnya di sini ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 Selain itu, webinar ini memberikan bukti yang lebih meyakinkan ... methods-colloquium.com/…
Mike Hunter
4
Secara teori, Anda BISA membuat inferensial kausal dengan menerapkan model kausal Rubin jika semua asumsi dipenuhi. Tetapi tentu saja iblis selalu dalam perincian asumsi, dan bagi saya, asumsi perancu yang tidak teramati sering kali sulit. Bahkan, tidak mungkin untuk dibuktikan. Tetapi Anda setidaknya bisa melakukan analisis sensitivitas untuk menentukan apa yang diperlukan untuk kesimpulan Anda untuk berubah jika Anda memiliki perancu yang tidak teramati.
StatsStudent
5
Poin bagus @ Johnson. Ada juga orang-orang seperti Judea Pearl, Ian Shrier, dan Arvid Sjolander yang kritis terhadap Kerangka Hasil Potensi Rubin untuk kesimpulan sebab akibat karena kemungkinan memperkenalkan "bias-M" melalui apa yang mereka sebut "collider." Mereka adalah bacaan yang menarik dan harus melengkapi bacaan apa pun dari Rubin.
StatsStudent

Jawaban:

12

Saya akan mencoba memberi Anda pemahaman intuitif dengan penekanan minimal pada matematika.

Masalah utama dengan data observasi dan analisis yang berasal darinya adalah membingungkan. Perancu terjadi ketika suatu variabel mempengaruhi tidak hanya perawatan yang diberikan tetapi juga hasilnya. Ketika eksperimen acak dilakukan, subjek diacak untuk perawatan sehingga, rata-rata, subyek yang ditugaskan untuk setiap perlakuan harus sama sehubungan dengan kovariat (usia, ras, jenis kelamin, dll). Sebagai hasil dari pengacakan ini, tidak mungkin (terutama dalam sampel besar) bahwa perbedaan hasil disebabkan oleh kovariat, tetapi karena perlakuan yang diterapkan, karena, rata-rata, kovariat dalam kelompok perlakuan adalah serupa.

Di sisi lain, dengan data pengamatan tidak ada mekanisme acak yang menetapkan subyek untuk perawatan. Ambil contoh sebuah studi untuk memeriksa tingkat kelangsungan hidup pasien setelah operasi jantung baru dibandingkan dengan prosedur bedah standar. Biasanya seseorang tidak dapat mengacak pasien untuk setiap prosedur karena alasan etis. Akibatnya, pasien dan dokter memilih sendiri ke dalam salah satu perawatan, seringkali karena sejumlah alasan terkait dengan kovariat mereka. Misalnya prosedur baru mungkin agak berisiko jika Anda lebih tua, dan akibatnya dokter mungkin merekomendasikan perawatan baru lebih sering kepada pasien yang lebih muda. Jika ini terjadi dan Anda melihat tingkat kelangsungan hidup, pengobatan baru mungkin tampak lebih efektif, tetapi ini akan menyesatkan karena pasien yang lebih muda ditugaskan untuk perawatan ini dan pasien yang lebih muda cenderung hidup lebih lama, semuanya sama. Di sinilah skor kecenderungan berguna.

Skor kecenderungan membantu dengan masalah mendasar dari inferensi kausal - bahwa Anda mungkin bingung karena subjek yang tidak diacak untuk perawatan dan ini mungkin menjadi penyebab "efek" yang Anda lihat daripada intervensi atau perawatan saja. Jika Anda dapat memodifikasi analisis Anda sehingga kovariat (misalnya usia, jenis kelamin, jenis kelamin, status kesehatan) “seimbang” antara kelompok perlakuan, Anda akan memiliki bukti kuat bahwa perbedaan hasil disebabkan oleh intervensi / pengobatan daripada kovariat ini. Skor kecenderungan, tentukan probabilitas masing-masing subjek untuk ditugaskan pada perawatan yang mereka terima dengan serangkaian kovarit yang diamati. Jika Anda kemudian mencocokkan probabilitas ini (skor kecenderungan),

Anda mungkin bertanya mengapa tidak sama persis dengan kovariat (mis. Pastikan Anda mencocokkan pria berusia 40 tahun dalam kesehatan yang baik dalam perawatan 1 dengan pria berusia 40 tahun dalam kesehatan yang baik dalam perawatan 2)? Ini berfungsi baik untuk sampel besar dan beberapa kovariat, tetapi menjadi hampir mustahil untuk dilakukan ketika ukuran sampel kecil dan jumlah kovariat bahkan berukuran sedang (lihat kutukan dimensi pada Cross-Validated untuk alasan ini) .

Sekarang, semua ini dikatakan, kelemahan Achilles dari skor kecenderungan adalah asumsi tidak ada perancu yang tidak teramati. Asumsi ini menyatakan bahwa Anda tidak gagal untuk memasukkan kovariat dalam penyesuaian Anda yang berpotensi perancu. Secara intuitif, alasan di balik ini adalah bahwa jika Anda belum memasukkan perancu saat membuat skor kecenderungan Anda, bagaimana Anda bisa menyesuaikannya? Ada juga asumsi tambahan seperti asumsi nilai unit perawatan yang stabil, yang menyatakan bahwa perlakuan yang diberikan pada satu subjek tidak mempengaruhi hasil potensial dari subyek lain.

StatsStudent
sumber
7

Dalam arti yang ketat, penyesuaian skor kecenderungan tidak lebih berkaitan dengan inferensial kausal daripada pemodelan regresi. Satu-satunya perbedaan nyata dengan skor kecenderungan adalah bahwa hal itu membuatnya lebih mudah untuk menyesuaikan pembaur potensial yang diamati daripada ukuran sampel yang memungkinkan model regresi untuk dimasukkan. Penyesuaian skor kecenderungan (paling baik dilakukan melalui penyesuaian kovariat di sebagian besar kasus, menggunakan spline dalam logit PS) dapat dianggap sebagai teknik reduksi data di mana reduksi berada di sepanjang sumbu penting - perancu. Namun itu tidak menangani heterogenitas hasil (bias kerentanan) sehingga Anda juga harus menyesuaikan untuk kovariat penting utama bahkan ketika menggunakan kecenderungan (lihat juga masalah yang terkait dengan rasio odds dan hazard yang tidak dapat ditiadakan).

Pencocokan skor kecenderungan dapat mengecualikan banyak pengamatan dan karenanya sangat tidak efisien. Saya melihat metode apa pun yang mengecualikan pengamatan relevan sebagai masalah. Masalah sebenarnya dengan pencocokan adalah bahwa tidak termasuk pengamatan yang mudah dicocokkan karena beberapa kebutuhan yang dirasakan untuk memiliki pencocokan 1: 1, dan sebagian besar algoritma pencocokan bergantung pada urutan pengamatan.

Perhatikan bahwa sangat mudah ketika melakukan penyesuaian regresi standar untuk pembaur untuk memeriksa dan mengecualikan wilayah yang tidak tumpang tindih. Para pengguna skor kecenderungan diajarkan untuk melakukan ini dan satu-satunya alasan pemodel regresi tidak melakukannya adalah karena mereka tidak diajari.

Analisis skor kecenderungan menyembunyikan setiap interaksi dengan pajanan, dan kecocokan skor kecenderungan menyembunyikan di samping hubungan yang mungkin antara PS dan efek pengobatan.

Analisis sensitivitas (terhadap perancu yang tidak terukur) telah berhasil untuk PS tetapi lebih mudah dilakukan dengan pemodelan regresi standar.

Jika Anda menggunakan metode regresi fleksibel untuk memperkirakan PS (misalnya, jangan menganggap variabel kontinu bertindak linier) Anda bahkan tidak perlu memeriksa saldo - harus ada keseimbangan atau model regresi PS tidak ditentukan dengan benar di awal . Anda hanya perlu memeriksa tidak tumpang tindih. Ini mengasumsikan tidak ada interaksi penting yang dihilangkan dari model kecenderungan. Pencocokan membuat asumsi yang sama.

Frank Harrell
sumber
3

Saya sarankan memeriksa Mostly Harmless Econometrics - mereka memiliki penjelasan yang baik tentang ini pada tingkat intuitif.

Masalah yang Anda coba selesaikan adalah bias seleksi. Jika variabel berkorelasi dengan hasil potensial dan dengan kemungkinan menerima pengobatan, maka jika Anda menemukan bahwa hasil yang diharapkan dari pengobatan lebih baik daripada hasil yang diharapkan dari yang tidak diobati, ini mungkin menjadi temuan palsu karena yang dirawat cenderung memiliki lebih tinggi dan karena itu memiliki . Masalah muncul karena membuat berkorelasi dengan perawatan.xiy0i,y1ixy0i,y1ixy0i,y1i

Masalah ini dapat diselesaikan dengan mengendalikan . Jika kami berpikir bahwa hubungan antara hasil potensial dan variabel adalah linier, kami hanya melakukan ini dengan memasukkan dalam regresi dengan variabel dummy untuk pengobatan, dan variabel dummy berinteraksi dengan . Tentu saja, regresi linier fleksibel karena kita dapat memasukkan fungsi juga. Tetapi bagaimana jika kita tidak ingin memaksakan bentuk fungsional? Maka kita perlu menggunakan pendekatan non-parametrik: pencocokan.xxxxx

Dengan pencocokan, kami membandingkan pengamatan yang diobati dan yang tidak diobati dengan sama . Kami menyimpang dari ini dengan perkiraan efek pengobatan untuk semua nilai (atau rentang kecil nilai atau "ember") yang telah kami perlakukan dan tidak diobati. Jika kita tidak memiliki banyak nilai atau keranjang seperti itu, khususnya jika adalah vektor dimensi tinggi sehingga sulit untuk menemukan pengamatan yang dekat satu sama lain, maka sangat membantu untuk memproyeksikan ruang ini ke satu dimensi.xxxx

Inilah yang dilakukan pencocokan skor kecenderungan. Jika tidak berkorelasi dengan pengobatan yang diberikan , maka ternyata mereka juga tidak berkorelasi dengan pengobatan yang diberikan mana adalah probabilitas pengobatan yang diberikan , yaitu skor kecenderungan dari .y0i,y1ixip(xi)p(x)xx

Inilah intuisi Anda: jika kami menemukan sub sampel pengamatan dengan skor kecenderungan yang sangat mirip , maka untuk sub-sampel itu, kelompok yang dirawat dan yang tidak diobati tidak berkorelasi dengan . Setiap pengamatan sama-sama cenderung diperlakukan atau tidak diobati; ini menyiratkan bahwa setiap pengamatan yang diperlakukan sama kemungkinannya berasal dari salah satu nilai dalam sub-sampel. Karena adalah yang menentukan hasil potensial dalam model kami, ini menyiratkan bahwa, untuk sub-sampel, hasil potensialp(x)xxxy0i,y1itidak berkorelasi dengan perawatan. Kondisi ini memastikan bahwa perbedaan rata-rata sub-sampel dari hasil antara yang diobati dan yang tidak diobati adalah perkiraan yang konsisten dari efek perlakuan rata-rata pada sub-sampel ini, yaitu

E[yi|Treated,p(x)]E[yi|Untreated,p(x)]

adalah perkiraan yang konsisten dari efek pengobatan rata-rata lokal.

Bacaan lebih lanjut:

Haruskah kita menggunakan pencocokan skor kecenderungan dalam praktik?

Pertanyaan terkait membandingkan pencocokan dan regresi

nfernand
sumber
1

Itu "bekerja" untuk alasan yang sama bahwa regresi "bekerja" - Anda mengendalikan semua faktor pembaur.

Anda dapat mencapai kontrol analitik seperti itu dengan model regresi yang ditentukan sepenuhnya dengan mungkin banyak variabel pengganggu, atau model regresi dengan hanya satu variabel - skor kecenderungan (yang mungkin atau mungkin tidak menjadi model yang sama rumitnya yang terdiri dari perancu yang sama). Anda bisa tetap dengan regresi ini vs skor kecenderungan, atau Anda bisa membandingkan respons dalam kelompok yang serupa, di mana kesamaan didefinisikan oleh skor kecenderungan. Dalam semangat Anda melakukan hal yang sama, tetapi beberapa orang merasa bahwa metode terakhir lebih baik menyoroti tugas kausal yang dihadapi.

Perbarui umpan balik berikut

Pemikiran saya untuk menjelaskan intuisi di balik mengapa pencocokan skor kecenderungan bekerja adalah untuk menjelaskan Teorema Skor Kecenderungan , yaitu, sesuatu yang saya pikir bisa saya lakukan dengan menggunakan regresi. Tetapi seperti yang dikatakan @StatsStudent, regresi membuatnya mudah untuk memperkirakan perbandingan antara pengobatan dan kontrol yang tidak pernah terjadi dalam data. Jika ini adalah bagian dari mengapa pencocokan skor kecenderungan "berhasil", maka jawaban saya tidak lengkap. Saya berkonsultasi dengan Counterfactuals dan Inferensial Penyebab

Y(0),Y(1)T|XY(0),Y(1)T|p(X),
dan baca tentang satu versi pencocokan tetangga terdekat, yang disebut "pencocokan caliper" (hlm. 108) di mana skor kecenderungan pengobatan dan kasus kontrol terdekat harus berada dalam jarak maksimum, yang mengakibatkan beberapa kasus perawatan tanpa kecocokan. Dalam hal ini, metode ini akan tetap bekerja dengan menyesuaikan skor kecenderungan menggunakan analog nonparametrik untuk regresi, tetapi juga memperjelas apa yang tidak dapat diketahui dari data saja (tanpa model untuk memperkirakan dari) dan memungkinkan redefinisi dari jumlah kausal yang diberikan data yang tersedia.
Ben Ogorek
sumber
1
Jawaban ini ditakdirkan untuk tidak disukai karena lebih murah metode skor kecenderungan dengan membandingkannya dengan regresi, kata kotor di kalangan kausal. Tetapi jawaban yang terkemuka mengakui bahwa "kelemahan Achilles dari skor kecenderungan adalah asumsi tidak ada pembaur yang tidak teramati." Itu tumit Achilles yang agak besar. Katakanlah anggapannya terpenuhi dan saya punya satu set data dengan semua perancu di alam semesta. Bantu saya memahami mengapa regresi tidak akan berhasil mengungkap kebenaran kausal tetapi kecocokan skor kecenderungan akan berhasil.
Ben Ogorek
1
Alasan mengapa regresi sering bermasalah adalah karena hasil dari regresi diekstrapolasi. Dengan skor kecenderungan, seseorang memastikan, selama pemeriksaan keseimbangan kovariat bahwa ada cukup pembaur yang tumpang tindih antara kelompok perlakuan. Ini belum tentu terjadi dalam regresi & dapat menyebabkan perkiraan yang tidak akurat karena tidak ada pemeriksaan diagnostik standar yang akan memberi tahu Anda bahwa model regresi Anda sedang diekstrapolasi. Itulah sebabnya saya biasanya menjalankan pemeriksaan penyeimbangan skor kecenderungan bahkan jika saya hanya menjalankan model regresi dan tidak berencana menggunakan skor kecenderungan sendiri.
StatsStudent