Dalam analisis skor kecenderungan, apa saja pilihan untuk menghadapi kecenderungan sangat kecil atau besar?

8

Saya prihatin dengan data pengamatan di mana tugas perawatan dapat dijelaskan dengan sangat baik. Misalnya, regresi logistik

P(SEBUAH=1|X)=(1+exp(-(Xβ)))-1

wehre tugas perawatan dan kovariat sangat cocok dengan tes sangat tinggi atau bahkan . Ini adalah kabar baik untuk keakuratan model kecenderungan, tetapi mengarah ke perkiraan skor kecenderungan tutup ke atau . Ini pada gilirannya menyebabkan bobot probabilitas invers besar dan digunakan dalam estimator seperti estimator berbobot probabilitas terbalik, ekspektasi hasil. (observasi dalam perawatan):SEBUAHXSEBUAHUC>0,80>.90

π^=(1+exp(-(Xβ^)))-1
01π^-1(1-π^)-1Y1

n-1sayaπsaya^-1SEBUAHsayaY1saya.

Saya kira ini mengubah varian perkiraan menjadi sangat besar.

Sepertinya lingkaran setan yang model skor kecenderungan sangat diskriminatif menyebabkan bobot yang ekstrim.

Pertanyaan saya : opsi apa yang tersedia untuk membuat analisis ini lebih kuat? Apakah ada alternatif yang sesuai dengan model skor kecenderungan atau bagaimana menghadapi beban besar setelah model tersebut sesuai?

Tomka
sumber
3
Anda mungkin ingin melihat kovariat dengan cermat. Anda harus memasukkan semua variabel yang mempengaruhi partisipasi dan hasil (bukan keduanya, tetapi keduanya). Termasuk yang terpengaruh oleh perawatan, baik ex post atau ex ante untuk mengantisipasi perawatan, adalah buruk. Secara khusus, termasuk instrumen - variabel yang mempengaruhi partisipasi dan bukan hasil - juga merupakan ide yang sangat buruk. Mereka tidak akan membantu dengan bias seleksi dan dapat memperburuk masalah dukungan secara drastis. Misalnya, jika beberapa orang dianjurkan untuk melakukan perawatan, Anda tidak ingin mengkondisikan itu.
Dimitriy V. Masterov
@ DimitriyV.Masterov Terima kasih; Poin terakhir Anda tampaknya menarik / relevan dengan situasi saya. Jadi, apakah Anda mengatakan yang terbaik adalah tidak menemukan model penugasan pengobatan yang terbaik (melainkan yang termasuk prediktor hasil dan penugasan)? Saya pikir semakin tepat kita dapat memprediksi tugas, semakin baik.
Tomka
2
Saya pikir itu adalah kesalahpahaman umum. Sebagai contoh, lihat makalah Battacharya dan Vogt (2012) dalam International Journal of Statistics and Economics pada poin instrumen.
Dimitriy V. Masterov
@ DimitriyV.Masterov sementara jawaban Anda mungkin memecahkan masalah kecenderungan kecil dalam beberapa situasi, itu mungkin masih terjadi bahwa himpunan X berhubungan dengan keduanya Y dan SEBUAH sangat diskriminatif SEBUAH. Saya masih tertarik pada opsi untuk mengatasi masalah ini.
Tomka

Jawaban:

5

Ini deteksi yang bagus. Anda mengacu pada asumsi positif. Ini mensyaratkan bahwa ada peserta yang terpapar dan tidak terpapar pada setiap kombinasi nilai-nilai dari pengacau yang diamati dalam populasi yang diteliti. Pelanggaran positif terjadi ketika subkelompok tertentu dalam sampel jarang atau tidak pernah menerima beberapa perlakuan yang menarik. Ada banyak makalah tentang topik ini, seperti Austin dan Stuart (2015) dan Peterson et al. (2012) . Anda dapat mencari lebih banyak secara online.

pengguna36400
sumber
2
Terima kasih, tetapi apakah Anda yakin? Saya mengacu pada bobot yang sangat kecil atau besar. Apa yang Anda gambarkan terdengar lebih seperti tumpang tindih antara distribusi kecenderungan unit yang dirawat vs yang tidak diobati (yang tampaknya disebut positif, saya tidak tahu). Namun, sepertinya ada tumpang tindih (kepositifan) sementara masih memiliki bobot yang ekstrem, bukan?
Tomka
Juga tidak mungkin ada tumpang tindih (kepositifan) sementara tidak memiliki bobot ekstrem, saya percaya.
Tomka
Makalah Austin & Stuart ini membahas penggunaan bobot yang distabilkan, yang mungkin berguna untuk situasi Anda.
Nuh
@Noah Melihat itu. Ini adalah titik awal yang baik. Sayangnya mereka tidak mendokumentasikan klaim ini dengan sangat baik dan pengaruhnya terhadap perkiraan ketika kecenderungan ekstrem tidak diketahui.
tomka