Tugas acak: mengapa repot?

9

Tugas acak sangat berharga karena memastikan independensi pengobatan dari hasil yang potensial. Itulah bagaimana hal itu mengarah pada perkiraan yang tidak bias dari efek pengobatan rata-rata. Tetapi skema penugasan lain juga dapat secara sistematis memastikan independensi pengobatan dari hasil yang potensial. Jadi mengapa kita perlu penugasan acak? Dengan kata lain, apa keuntungan penugasan acak dari skema penugasan non-acak yang juga mengarah pada kesimpulan yang tidak bias?

Biarkan menjadi vektor tugas perawatan di mana setiap elemen adalah 0 (unit tidak ditugaskan untuk perawatan) atau 1 (unit yang ditugaskan untuk perawatan). Dalam sebuah artikel JASA , Angrist, Imbens, dan Rubin (1996, 446-47) mengatakan bahwa penugasan perawatan adalah acak jika untuk semua \ mathbf {c} dan \ mathbf {c'} sedemikian rupa sehingga \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , dengan \ iota adalah a vektor kolom dengan semua elemen sama dengan 1.ZZiPr(Z=c)=Pr(Z=c)ccιTc=ιTcι

Dengan kata lain, klaimnya adalah bahwa penugasan Zi adalah acak jika setiap vektor penugasan yang mencakup penugasan m untuk perawatan adalah sama mungkinnya dengan vektor lain yang mencakup penugasan m untuk penangan.

Tetapi, untuk memastikan independensi hasil potensial dari penugasan pengobatan, cukup untuk memastikan bahwa setiap unit dalam penelitian ini memiliki probabilitas penugasan yang sama untuk pengobatan. Dan itu dapat dengan mudah terjadi bahkan jika sebagian besar vektor penugasan pengobatan memiliki probabilitas nol untuk dipilih. Artinya, itu dapat terjadi bahkan di bawah penugasan non-acak.

Berikut ini sebuah contoh. Kami ingin menjalankan percobaan dengan empat unit di mana tepatnya dua diperlakukan. Ada enam kemungkinan vektor penugasan:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

di mana digit pertama di setiap angka menunjukkan apakah unit pertama dirawat, digit kedua menunjukkan apakah unit kedua dirawat, dan seterusnya.

Misalkan kita menjalankan percobaan di mana kita mengecualikan kemungkinan penugasan vektor 3 dan 4, tetapi di mana masing-masing vektor lainnya memiliki peluang yang sama (25%) untuk dipilih. Skema ini bukan tugas acak dalam arti AIR. Tetapi dengan harapan, hal itu mengarah pada perkiraan yang tidak bias dari efek pengobatan rata-rata. Dan itu bukan kecelakaan. Skema penugasan apa pun yang memberikan peluang yang sama kepada subyek untuk penugasan terhadap pengobatan akan memungkinkan estimasi ATE yang tidak bias.

Jadi: mengapa kita perlu penugasan acak dalam arti AIR? Argumen saya berakar pada inferensi pengacakan; jika orang berpikir sebaliknya dalam hal inferensi berbasis model, apakah definisi AIR tampak lebih dapat dipertahankan?

pengguna697473
sumber
3
Saya belum membaca Angrist et al., Jadi mungkin saya kehilangan sesuatu, tetapi saya memiliki quibble dengan frasa Anda. Kami tidak menggunakan penugasan acak untuk memastikan bahwa perawatan tidak tergantung pada hasil potensial. Apakah pengobatan independen dari hasil dalam percobaan yang benar tergantung pada apakah ada hubungan sebab akibat langsung dengan pengobatan & hasilnya. Sebaliknya, penugasan acak memastikan bahwa perawatan tidak tergantung pada variabel yang mengintai (atau, pembaur potensial). Adalah kemungkinan bahwa hasil itu disebabkan oleh sesuatu selain dari perawatan yang kami harap untuk dikecualikan.
gung - Reinstate Monica
1
@ung, saya pikir Anda sedang menyatukan "hasil potensial" dan "hasil." Memang benar bahwa penugasan acak tidak memastikan independensi pengobatan dari hasil (yaitu, dari hasil yang diamati). Tetapi hasil potensial tidak sama dengan hasil yang diamati, dan penugasan acak memastikan independensi pengobatan dari hasil yang potensial. Saya tidak akan mengedit posting asli untuk memperluas tentang hal ini; melakukan hal itu akan membawa saya terlalu jauh dari topik utama. Tetapi en.wikipedia.org/wiki/Rubin_causal_model dapat membantu dalam hal ini.
user697473
3
"Untuk memastikan independensi hasil potensial dari penugasan pengobatan, cukup untuk memastikan bahwa setiap unit dalam penelitian ini memiliki probabilitas penugasan yang sama untuk pengobatan." Ini salah. Misalkan Anda telah mendaftarkan pria dan wanita dalam sebuah penelitian. Balik koin yang adil: jika kepala, tetapkan semua perempuan ke kelompok perlakuan (dan semua laki-laki ke kelompok kontrol); jika berekor, semua laki-laki akan berada dalam kelompok perlakuan dan semua perempuan dalam kelompok kontrol. Setiap subjek (jelas) memiliki kemungkinan penugasan 50% untuk kelompok perlakuan - tetapi perawatan sepenuhnya dikacaukan dengan gender. xx
whuber
1
@whuber, komentar Anda tidak terdengar benar. Untuk melihat alasannya, misalkan = 1. Hasil potensial pria adalah Y (1) = 1 dan Y (0) = 0. (Yaitu, = 1 jika pria itu dirawat, 0 jika tidak.) Untuk wanita itu, hasil potensial adalah Y (1) = -1 dan Y (0) = 2. (Hasil potensial tertentu tidak terlalu penting, tetapi bilangan bulat kecil membuat hal-hal sederhana.) Kemudian E [Y (1) | Z] = E [Y (1)] = 0. Kesamaan yang sama berlaku untuk E [Y (0)]. Secara umum, mekanisme penugasan Anda tidak dikacaukan dengan gender, dan itu akan menghasilkan estimasi ATE yang tidak bias. Jika saya salah paham akan sesuatu, beri tahu saya. xYm
user697473
3
Tentu, perkiraan tersebut "tidak bias" dalam arti yang sama dengan jam yang berhenti memberikan perkiraan waktu yang tidak bias! Sebenarnya, ini lebih buruk dari itu: metode seleksi acak ini menghasilkan hasil yang tidak dapat dikaitkan dengan perawatan, karena mereka juga dapat dikaitkan dengan jenis kelamin. Itulah yang mengacaukan artinya. Berfokus pada memperoleh hasil yang tidak memihak sambil menghancurkan semua informasi yang berguna dalam percobaan adalah pepatah yang membuang bayi ...
whuber

Jawaban:

8

Ini menindaklanjuti komentar gung. Keseluruhan efek pengobatan rata-rata bukan itu intinya.

Misalkan Anda memiliki kasus diabetes baru di mana subjeknya berusia antara dan , dan pasien diabetes baru di atas . Anda ingin menetapkan setengah untuk perawatan. Mengapa tidak melempar koin, dan pada kepala, merawat semua pasien muda, dan pada ekor, merawat semua pasien yang lebih tua? Masing-masing akan memiliki100051510003050%kesempatan untuk dipilih dari perawatan, jadi ini tidak akan membiaskan hasil rata-rata dari perawatan, tetapi itu akan membuang banyak informasi. Tidak mengherankan jika diabetes remaja atau pasien yang lebih muda ternyata merespons jauh lebih baik atau lebih buruk daripada pasien yang lebih tua dengan tipe II atau diabetes gestasional. Efek pengobatan yang diamati mungkin tidak bias tetapi, misalnya, itu akan memiliki standar deviasi yang jauh lebih besar daripada yang akan terjadi melalui penugasan acak, dan meskipun sampel besar Anda tidak akan bisa berkata banyak. Jika Anda menggunakan penugasan acak, maka dengan probabilitas tinggi sekitar kasus di setiap kelompok umur akan mendapatkan pengobatan, sehingga Anda akan dapat membandingkan pengobatan dengan tidak ada perawatan dalam setiap kelompok umur. 500

Anda mungkin bisa melakukan lebih baik daripada menggunakan penugasan acak. Jika Anda memperhatikan faktor yang menurut Anda dapat memengaruhi respons terhadap pengobatan, Anda mungkin ingin memastikan bahwa subjek dengan atribut itu terbagi lebih rata daripada yang akan terjadi melalui penugasan acak. Tugas acak memungkinkan Anda melakukannya dengan cukup baik dengan semua faktor secara bersamaan, sehingga Anda dapat menganalisis banyak pola yang mungkin terjadi setelahnya.

Douglas Zare
sumber
Terima kasih, Douglas. Jawaban ini masuk akal bagi saya. Sebagai catatan, saya tidak memiliki pikiran ekstrem seperti contoh Anda atau contoh @ whuber di atas. Saya berpikir alih-alih kasus-kasus di mana kita menghilangkan dari pertimbangan hanya beberapa vektor pengobatan. (Pertimbangkan sebuah kasus di mana seorang klien mengatakan "Anda dapat memperlakukan orang ini atau itu, tetapi tidak keduanya.") Tetapi saya pikir poin umum Anda berlaku bahkan untuk kasus yang lebih ringan yang ada dalam pikiran saya.
user697473
Saya pikir jika Anda hanya menghilangkan beberapa vektor, maka Anda tidak mengubah jumlah informasi yang dapat Anda ekstrak. Mengukur ini secara akurat mungkin berantakan - ada batasan naif yang mungkin terlalu pesimistis.
Douglas Zare
@DouglasZare Saya punya pertanyaan tentang contoh ekstrem Anda. Saya percaya tujuannya adalah untuk menemukan apakah pengobatan ini efektif untuk populasi yang memiliki pasien muda dan tua. Kemudian, metode Anda akan menghasilkan dua sampel yang tidak dapat dianggap sebagai sampel representatif dari distribusi hasil potensial mana semua orang mengambil pengobatan dan distribusi hasil potensial mana semua orang mengambil kendali. Jadi efek pengobatan yang Anda amati menjadi biasFtFc
KevinKim
1

Dalam contoh Anda, Anda dapat meninggalkan 2 dan 5 juga dan tidak bertentangan dengan diri Anda sendiri. Pada level item masih ada peluang yang sama untuk menjadi 1 atau 0 ketika ada peluang 1: 1 untuk memilih 1 atau 6. Tapi, sekarang apa yang Anda lakukan dengan menghapus 3 dan 4 menjadi lebih jelas.

John
sumber
Terima kasih, John. Ya kamu benar. Tampaknya kita dapat menghilangkan vektor tugas pengobatan sebanyak yang kita suka, dalam kombinasi apa pun, selama kita menggunakan vektor yang tersisa dengan cara yang memberikan masing-masing unit peluang yang sama untuk penugasan pengobatan.
user697473
Saya tidak berpikir Anda mendapatkan apa yang saya katakan. Apa yang saya presentasikan adalah kasus ad absurdum untuk argumen Anda yang membantahnya.
John
Teladan Anda ekstrem, tetapi saya tidak melihat sesuatu yang absurd tentang hal itu. Ini adalah demonstrasi yang valid dari poin: skema penugasan nonrandom (seperti hanya menggunakan vektor 1 dan 6) dapat mengarah langsung ke estimasi yang tidak bias dari efek pengobatan rata-rata. Oleh karena itu, kami tidak perlu penugasan acak untuk mendapatkan taksiran ATE yang tidak bias. Tentu saja, mungkin masih ada alasan mengapa menghilangkan vektor 2 sampai 5. buruk (Lihat komentar Douglas Zare di atas .) Saya belum memikirkan alasan-alasan ini.
user697473
Kamu harus Itu sebabnya Anda tidak bisa menghilangkannya.
John
1

Berikut ini salah satu dari variabel yang mengintai atau membingungkan: waktu (atau penyimpangan instrumental, efek penyimpanan sampel, dll.).
Jadi ada argumen yang menentang pengacakan (seperti yang dikatakan Douglas: Anda mungkin melakukan lebih baik daripada pengacakan). Misalnya, Anda dapat mengetahui sebelumnya bahwa Anda ingin kasing Anda seimbang dari waktu ke waktu. Seperti yang Anda ketahui sebelumnya bahwa Anda ingin memiliki jenis kelamin dan usia yang seimbang.

Dengan kata lain, jika Anda ingin secara manual memilih salah satu dari 6 skema Anda, saya akan mengatakan bahwa 1100 (atau 0011) adalah pilihan yang jelas buruk . Perhatikan bahwa kemungkinan pertama yang Anda buang adalah yang paling seimbang dalam waktu ... Dan yang terburuk dua yang tersisa setelah John mengusulkan untuk membuang juga 2 dan 5 (yang tidak Anda protes).
Dengan kata lain, intuisi Anda yang skema "bagus" sayangnya mengarah ke desain eksperimental yang buruk (IMHO ini cukup umum; mungkin hal-hal yang dipesan terlihat lebih baik - dan yang pasti lebih mudah untuk melacak urutan logis selama percobaan).

Anda mungkin dapat melakukan lebih baik dengan skema non-acak, tetapi Anda juga dapat melakukan jauh lebih buruk. IMHO, Anda harus dapat memberikan argumen fisik / kimia / biologis / medis / ... untuk skema non-acak tertentu yang Anda gunakan, jika Anda menggunakan skema non-acak.

cbeleites tidak senang dengan SX
sumber