Bagaimana skor kecenderungan berbeda dari menambahkan kovariat dalam regresi, dan kapan mereka lebih disukai daripada yang terakhir?

41

Saya akui bahwa saya relatif baru dalam hal skor kecenderungan dan analisis kausal.

Satu hal yang tidak jelas bagi saya sebagai pendatang baru adalah bagaimana "menyeimbangkan" menggunakan skor kecenderungan secara matematis berbeda dari apa yang terjadi ketika kita menambahkan kovariat dalam regresi? Apa yang berbeda tentang operasi, dan mengapa lebih baik daripada menambahkan kovariat subpopulasi dalam regresi?

Saya telah melihat beberapa studi yang melakukan perbandingan metode secara empiris, tetapi saya belum melihat diskusi yang baik yang berkaitan dengan sifat matematika dari dua metode dan mengapa PSM cocok untuk interpretasi kausal sementara termasuk kovariat regresi tidak. Tampaknya juga ada banyak kebingungan dan kontroversi di bidang ini, yang membuat segalanya semakin sulit untuk diambil.

Adakah pemikiran tentang hal ini atau petunjuk tentang sumber daya / makalah yang baik untuk lebih memahami perbedaan? (Aku perlahan-lahan membuat jalan melalui buku kausalitas Judea Pearl, jadi tidak perlu mengarahkan saya ke sana)

Frank Barry
sumber
3
Rekomendasikan Anda membaca Morgan dan Winship, 2007 . Bab 4 dan 5 melakukan perbandingan eksplisit dan kontras regresi dan pencocokan untuk identifikasi efek sebab akibat.
conjugateprior
1
Ketika Anda memeriksa statistik saldo, Anda memastikan bahwa tidak ada ekstrapolasi antara kelompok perlakuan yang Anda bandingkan sehubungan dengan ruang kovariat multidimensi. Regresi hanya mengekstrapolasi tanpa memeriksa ini, sehingga ekstrapolasi dapat memberikan prediksi yang buruk.
StatsStudent

Jawaban:

17

Satu perbedaan besar adalah bahwa regresi "mengendalikan" karakteristik-karakteristik itu secara linear. Mencocokkan dengan skor kecenderungan menghilangkan asumsi linearitas, tetapi, karena beberapa pengamatan mungkin tidak cocok, Anda mungkin tidak dapat mengatakan apa-apa tentang kelompok tertentu.

Misalnya, jika Anda mempelajari program pelatihan pekerja, Anda mungkin memiliki semua pendaftar adalah pria, tetapi kontrol, populasi non-peserta terdiri dari pria dan wanita. Menggunakan regresi, Anda bisa mundur, pendapatan, katakanlah, pada variabel indikator partisipasi dan indikator pria. Anda akan menggunakan semua data Anda dan dapat memperkirakan pendapatan seorang wanita jika ia berpartisipasi dalam program ini.

Jika Anda melakukan pencocokan, Anda hanya bisa mencocokkan pria dengan pria. Akibatnya, Anda tidak akan menggunakan wanita mana pun dalam analisis Anda dan hasil Anda tidak akan berkaitan dengan mereka.

Regresi dapat memperkirakan dengan menggunakan asumsi linearitas, tetapi pencocokan tidak bisa. Semua asumsi lain pada dasarnya sama antara regresi dan pencocokan. Manfaat dari pencocokan lebih dari regresi adalah bahwa itu non-parametrik (kecuali Anda memang harus berasumsi bahwa Anda memiliki skor kecenderungan yang tepat, jika itu adalah bagaimana Anda melakukan pencocokan Anda).

Untuk diskusi lebih lanjut, lihat halaman saya di sini untuk kursus yang sangat fokus pada metode yang cocok. Lihat terutama Asumsi Strategi Estimasi Efek Penyebab .

Juga, pastikan untuk memeriksa artikel Rosenbaum dan Rubin (1983) yang menguraikan pencocokan skor kecenderungan.

Terakhir, pencocokan telah berjalan jauh sejak tahun 1983. Periksa halaman web Jas Sekhon untuk mempelajari tentang algoritma pencocokan genetiknya.

Charlie
sumber
3
Mungkin ini karena saya bukan ahli statistik, tetapi ketika tampaknya Anda mengasumsikan regresi linier ketika OP bertanya tentang regresi secara umum. Tapi saya kira intinya adalah bahwa menambahkan kovariat ke segala jenis regresi membuat beberapa asumsi tentang ruang input sehingga dapat melakukan ekstrapolasi ke contoh baru, dan pencocokan lebih berhati-hati tentang hal-hal apa yang dapat diekstrapolasi.
rrenaud
2
Anda memang membuat beberapa asumsi tentang bentuk fungsional dari variabel pengganggu ketika Anda memperkirakan fungsi kecenderungan. Selanjutnya Anda juga mencocokkan individu yang memiliki nilai "dekat" dari kecenderungan, jadi saya tidak akan langsung berasumsi bahwa kecocokan kecenderungan memecahkan masalah efek perancu nonlinear.
AdamO
2
Tautan rusak.
Carlos Cinelli
11

Jawaban singkatnya adalah bahwa skor kecenderungan tidak lebih baik daripada model ANCOVA yang setara, terutama yang berkaitan dengan interpretasi kausal.

Skor kecenderungan paling baik dipahami sebagai metode reduksi data. Mereka adalah cara yang efektif untuk mengurangi banyak kovariat menjadi skor tunggal yang dapat digunakan untuk menyesuaikan efek yang menarik untuk satu set variabel. Dengan melakukan itu, Anda menghemat derajat kebebasan dengan menyesuaikan skor kecenderungan tunggal daripada beberapa kovariat. Ini menyajikan keuntungan statistik, tentu saja, tetapi tidak lebih.

Satu pertanyaan yang mungkin muncul ketika menggunakan penyesuaian regresi dengan skor kecenderungan adalah apakah ada keuntungan dalam menggunakan skor kecenderungan daripada melakukan penyesuaian regresi dengan semua kovariat yang digunakan untuk memperkirakan skor kecenderungan yang termasuk dalam model. Rosenbaum dan Rubin menunjukkan bahwa "estimasi titik efek pengobatan dari analisis penyesuaian kovarians untuk multivariat X sama dengan estimasi yang diperoleh dari penyesuaian kovarians univariat untuk sampel diskriminan linier berdasarkan X, setiap kali matriks kovarians sampel yang sama digunakan untuk penyesuaian kovarians dan analisis diskriminan ". Dengan demikian, hasil dari kedua metode harus mengarah pada kesimpulan yang sama. Namun, satu keuntungan untuk melakukan prosedur dua langkah adalah bahwa seseorang dapat memenuhi model skor kecenderungan yang sangat rumit dengan interaksi dan persyaratan urutan yang lebih tinggi terlebih dahulu. Karena tujuan dari model skor kecenderungan ini adalah untuk mendapatkan estimasi kemungkinan penugasan pengobatan yang terbaik, orang tidak perlu terlalu men-parameterkan model ini.

Dari:

METODE PROPENSITAS SKOR UNTUK PENGURANGAN BIAS DALAM PERBANDINGAN PENGOBATAN DENGAN KELOMPOK PENGENDALIAN YANG TIDAK DAPAT DIANDALKAN

D'Agostino (mengutip Rosenbaum dan Rubin)

D'agostino, RB 1998. Pencocokan skor kecenderungan untuk pengurangan bias dalam perbandingan pengobatan dengan kelompok kontrol non-acak. Kedokteran Statistik 17: 2265–2281.

Brett
sumber
5
(+1) Ada juga utas menarik tentang masalah kausalitas dalam pertanyaan terkait ini, Dari sudut pandang statistik, dapatkah seseorang menyimpulkan kausalitas menggunakan skor kecenderungan dengan studi observasional? .
chl
3
Saya setuju dengan premis umum dari jawaban ini, tetapi ketika seseorang mencocokkan berdasarkan skor kecenderungan itu tidak sama dengan memasukkan semua kovariat ke dalam model (dan karenanya bukan hanya teknik pengurangan dimensi). Ini tidak sama jika seseorang menimbang berdasarkan skor kecenderungan juga.
Andy W
1
Saya tidak setuju dengan jawaban ini. Skor kecenderungan diperkirakan baik ketika mereka menyeimbangkan kovariat dalam kelompok perlakuan dan kontrol dan buruk ketika tidak. Sama seperti untuk pendekatan pengkondisian regresi. Apakah mereka 'lebih baik' hanya bergantung pada properti itu, yang akan bervariasi dari satu masalah ke masalah lainnya.
conjugateprior
1
Saya tidak setuju karena sementara kriteria, keseimbangan, sama, kedua strategi itu berbeda, seperti kekuatan dan kelemahan mereka. Seseorang mungkin atau mungkin bukan pendekatan yang lebih baik, tergantung pada masalahnya. Memang, ' model ANCOVA yang setara ' bagi saya tampaknya tidak didefinisikan dengan baik. (Setara caranya?)
conjugateprior
1
Kanan. Saya sekarang melihat apa yang dimaksud 'setara', tetapi kalimat yang dimulai 'Namun' dalam kutipan Anda memperkenalkan perbedaan yang relevan: dalam praktiknya prop. skor diestimasi secara terpisah secara tepat sehingga mereka dapat menjadi jauh lebih rumit daripada model analisis. (Dan ada perbedaan lain dalam paragraf artikel berikut, tidak dikutip.)
conjugateprior
7

Referensi yang kemungkinan tumpul, tetapi jika Anda secara kebetulan memiliki akses ke sana saya akan merekomendasikan membaca bab buku ini ( Apel dan Sweeten, 2010 ). Ini ditujukan untuk ilmuwan sosial dan jadi mungkin tidak seketat matematis seperti yang Anda inginkan, tetapi harus masuk ke kedalaman yang cukup untuk menjadi lebih dari jawaban yang memuaskan untuk pertanyaan Anda.

Ada beberapa cara orang memperlakukan skor kecenderungan yang dapat menghasilkan kesimpulan yang berbeda dari hanya memasukkan kovariat dalam model regresi. Ketika satu kecocokan skor, seseorang tidak harus memiliki dukungan yang sama untuk semua pengamatan (yaitu seseorang memiliki beberapa pengamatan yang tampaknya tidak pernah memiliki kesempatan untuk berada dalam kelompok perlakuan, dan beberapa yang selalu dalam kelompok perlakuan). Kita juga dapat melakukan pengamatan berat badan dengan berbagai cara yang dapat menghasilkan kesimpulan yang berbeda.

Selain jawaban di sini saya juga menyarankan Anda memeriksa jawaban untuk pertanyaan yang dikutip chl. Ada lebih banyak substansi di balik skor kecenderungan daripada sekadar trik statistik untuk mencapai keseimbangan kovariat. Jika Anda membaca dan memahami artikel-artikel yang sangat dikutip oleh Rosenbaum dan Rubin, akan lebih jelas mengapa pendekatannya berbeda dari sekadar menambahkan kovariat dalam model regresi. Saya pikir jawaban yang lebih memuaskan untuk pertanyaan Anda tidak harus dalam matematika di balik skor kecenderungan tetapi dalam logika mereka.

Andy W
sumber
@Andy W Lihat kutipan dari Rosenbaum dan Rubin pada kesetaraan regresi dengan kovariat dan penyesuaian skor kecenderungan dalam posting saya yang diperbarui.
Brett
0

Saya suka menganggap PS sebagai bagian desain penelitian yang sepenuhnya terpisah dari analisis. Artinya, Anda mungkin ingin berpikir dalam hal desain (PS) dan analisis (regresi dll ...). Juga, PS memberikan cara untuk mendukung pertukaran untuk pengobatan biner; mungkin orang lain dapat mengomentari apakah memasukkan kovariat dalam model hasil dapat benar-benar mendukung pertukaran, atau apakah seseorang menganggap dapat dipertukarkan sebelum memasukkan kovariat dalam model hasil.

Teori Galois
sumber
-3

Metode Stat Med Res. 2016 19 April

Evaluasi bias dalam model regresi non-linier yang disesuaikan dengan skor kecenderungan.

Metode skor kecenderungan umumnya digunakan untuk menyesuaikan perancu yang diamati ketika memperkirakan efek pengobatan kondisional dalam studi observasi. Salah satu metode populer, penyesuaian kovariat skor kecenderungan dalam model regresi, secara empiris terbukti bias dalam model non-linear. Namun, tidak ada alasan teoritis yang mendasari yang meyakinkan telah disajikan. Kami mengusulkan kerangka kerja baru untuk menyelidiki bias dan konsistensi efek pengobatan yang disesuaikan dengan skor kecenderungan pada model non-linier yang menggunakan pendekatan geometris sederhana untuk menjalin hubungan antara konsistensi penduga skor kecenderungan dan kolapibilitas model non-linear. Di bawah kerangka kerja ini, kami menunjukkan bahwa penyesuaian skor kecenderungan dalam model hasil menghasilkan dekomposisi kovariat yang diamati menjadi skor kecenderungan dan sisa jangka waktu. Penghapusan jangka waktu sisa ini dari model regresi yang tidak dapat dilipat menyebabkan estimasi bias dari rasio peluang bersyarat dan rasio bahaya bersyarat, tetapi tidak untuk rasio tarif bersyarat. Kami selanjutnya menunjukkan, melalui studi simulasi, bahwa bias dalam pendugaan yang disesuaikan dengan skor kecenderungan ini meningkat dengan ukuran efek perawatan yang lebih besar, efek kovariat yang lebih besar, dan meningkatnya ketidaksamaan antara koefisien kovariat dalam model perawatan versus model hasil.

dt2016
sumber