Komputasi bobot probabilitas terbalik - estimasi kepadatan bersyarat (multivarian)?

8

Versi umum:

Saya perlu memperkirakan f(A|X) dimana A dan Xkontinu dan multivarian. Saya lebih suka melakukannya secara nonparametrik karena saya tidak memiliki bentuk fungsional yang baik dalam pikiran danf^(A|X)perlu sesuatu seperti tidak bias. Saya ingin menggunakan penduga kepadatan kernel bersyarat, tetapi saya sadar saya perlu mengukurXpertama. Lalu saya punya ide untuk memperkirakanf^(A,X) dan f^(X) dari data dan menggunakannya untuk menghitung f^(A|X), atau mungkin saya membacanya di suatu tempat dan tidak ingat di mana.

Apakah ada alasan mengapa prosedur ini tidak valid? Apakah ada pendekatan yang lebih baik atau lebih jujur ​​daripada kepadatan kernel? Juga, apakah ada masalah dengan estimasi kepadatan populasi dari kepadatan sampel secara nonparametrik? Data ini adalah data survei, dan saya memiliki bobot survei; haruskah saya memasukkan mereka entah bagaimana?


Versi spesifik kasus:

Mungkin perlu disebutkan bahwa saya akan menggunakan estimasi ini untuk bobot probabilitas pengobatan yang terbalik dalam model struktural marjinal, seperti dalam Robins (2000) ( ungated PDF ). Saya mengamati serangkaian "perawatan"{at}t=04 dan urutan pembaur waktu yang bervariasi {xt}t=04 sehubungan dengan beberapa hasil y~ yang terjadi pada t=T+1. Saya telah berhipotesis hubungan kausal parametrik sederhana,E[Y~|a]=βa, tapi karena ada perancu yang bervariasi waktu β adalah perkiraan bias dari "efek pengobatan rata-rata," dan perancu tidak dapat ditambahkan sebagai regressor karena berada di jalur sebab akibat dan itu juga akan bias β. Untungnya Doc Robins menemukan bahwa saya bisa mendapatkan perkiraan yang tidak memihak / tidak berdasar dan cukup efisien jika saya menimbang kembali pengamatan saya dengan:

wi=s=04f(as|as<t)f(as|as<t,xs<t)

Pertanyaan saya: Urutan bobot itu sebenarnya yang saya butuhkan untuk estimasi. Robins merekomendasikan regresi logistik. Tapiat terletak di [0,)7, diukur pada {0,}7, dan untuk semua tujuan praktis terletak pada subset yang terbatas. xt terletak pada interval tertutup, tetapi hanya karena itu benar-benar rata-rata dari beberapa variabel, masing-masing diukur pada subset terbatas {0,,12}.

Jadi saya punya beberapa ide:

  1. Memperkirakan f(at,as<t,xs<t) dan f(x,as<t) nonparametrik
  2. Memperkirakan f(at|as<t,xs<t) dengan regresi beta dan f(xs<t,as<t) nonparametrik
  3. Memperkirakan f(xt1|at,as<t,xs<(t1)) dengan regresi beta, dan estimasi f(at,as<t,xs<(t1))) dengan "chaining" regresi beta kembali melalui waktu untuk mengekspresikan semuanya sebagai persyaratan.
  4. Sesuatu yang benar-benar koheren dan jujur ​​dalam menyebarkan ketidakpastian, yang jelas saya belum pikirkan.
  5. Bayes? Saya tahu Stan dan JAGS, tetapi MCMC mungkin akan meledak komputer saya (saya tidak ingin berurusan dengan EC2).

Saya belum menemukan petunjuk dalam literatur, karena perawatan multivariat jarang terjadi dalam pemodelan kausal. Apa yang harus saya lakukan?

Poin bonus: bagaimana perasaan Anda tentang notasi as<t untuk mewakili {as}s=0t bukannya sesuatu seperti at1?

shadowtalker
sumber

Jawaban:

10

Ide dasarnya

Per Chen, Linton, dan Robinson (2001) , teknik "default" untuk estimasi kepadatan kernel univariat adalah mencari, untuk bandwidtha,b,c,

f^ab(y,z)f^c(z)=f^abc(y|z)

Kemudian, dengan bandwidth pembilang (a,b) dan bandwidth penyebut c dan a=b=c, hasil batas pusat berikut berpegang pada asumsi independensi dan konsistensi tertentu (yang hanya benar-benar membatasi kapan y=xt,z=xt1):

na2(f^abc=aaa(y|z)f(y|z))dN(0,V)

dimana

V^=(K(u)2du)2f^aaa(y|z)f^a(z)=(K(u)2du)2f^aa(y,z)

Meskipun saya belum pernah melihat model tertimbang yang sering (bahkan intro-stats WLS) berusaha menghitung variasi dari bobot yang diperkirakan. Untuk saat ini saya akan mengikuti konvensi itu tetapi jika saya mendapatkan hasil di sini saya akan melihat apakah saya dapat mengubahnya menjadi model Bayesian yang sepenuhnya yang akan menyebarkan ketidakpastian dengan lebih jujur. Jadi ya, memperkirakan kepadatan bersyarat dengan memperkirakan kepadatan bersama dan marginal adalah prosedur standar.

Berlaku untuk kasus saya

Tidak secara eksplisit jelas dari makalah itu adalah bagaimana ini digeneralisasikan ke kasus kapan ketika y=xt dan z=(xs)s=1t1, dan xs=(xs,1xs,D). Tapi saya kira ini benar-benar sama dengan satu urutan panjang yang besarx=((xs,d)d=1D)s=1t1yang tampaknya dikelola dengan sempurna menurut Robinson (1983) (dikutip dalam Chen, et al). Sekali lagi, menggunakan aturan Bayes untuk memperkirakan kepadatan bersyarat tampaknya dapat diterima.

Bandwidth

Masalah terakhir adalah pemilihan bandwidth. Bandwidth sekarang menjadi matriks blok formulir

B=(Bnumerator00Bdenominator)=((a1,1B1numB2numat,D)00(c1,1B1denomB2denomct1,D))

yang berantakan. Saat bandwidthH=hH0 seperti yang |H0|=1, kemudian bN4+D, tetapi hasil ini akan berlaku secara terpisah untuk Bnum dan Bdenom bukannya ke Bsecara keseluruhan ( sumber , catatan kuliah seseorang).

Chen et al menemukan bandwidth yang optimal a=b=c(dalam kasus 2-d) untuk tingkat tertentuz yang sepertinya digeneralisasi ke kasus kapan y dan zbersifat multivariat. Mereka menyarankan pengaturanz=μ dimana μ adalah rata-rata teoritis yang akan diinduksi di bawah normalitas sendi, dan mereka diturunkan a^(μ).

Versi yang lebih umum dari hasil yang sama ada di bagian lain dari catatan kuliah tersebut, yang disebut bandwidth "rule-of-thumb". Mereka juga memperoleh bandwidth optimal sebagai fungsi dari prosedur validasi silang umum.

Komputasi

Saya memiliki perawatan 7 dimensi selama 3 periode waktu, jadi saya harus memperkirakan kepadatan 21 dimensi. Dan saya lupa tentang kovariat awal. Saya memiliki sekitar 30 kovariat awal, jadi saya akhirnya mencoba memperkirakan distribusi 51 dimensi, distribusi 44 dimensi, dan distribusi 37 dimensi. Dan itu belum lagi bahwa dimensi ekstrim akan membutuhkan sampel yang sangat besar. Scott & Wand (1991) melaporkan bahwa ukuran sampel 50 dalam satu dimensi setara dengan lebih dari 1 juta dalam 8 dimensi ... tidak disebutkan 30. Tidak ada jumlah ini yang dapat mengungkapkan apa yang saya rasakan saat ini.

Kesimpulan

Jadi saya hanya menghabiskan satu minggu dari hidup saya untuk ini. Baiklah. Sebagai gantinya, saya akan menggunakan MCMC agar sesuai dengan model parametrik pengobatan dan hasil secara bersamaan, sehingga bobot IPT akhirnya menjadi fungsi kepadatan prediksi posterior dari model pengobatan. Kemudian saya akan melangkah melalui bentuk linier, kuadratik, dan kubik untuk model perawatan dan melihat mana yang paling cocok.

shadowtalker
sumber
6
"Jadi, aku hanya menghabiskan satu minggu hidupku untuk ini." Itu disebut pembelajaran dan penelitian. Menjadi mahasiswa master Anda harus merangkul itu karena ada lebih banyak seperti ini datang. Biasanya tidak ada jalan pintas dalam penelitian karena seringkali tidak ada yang tahu jalannya!
Momo