Tugas acak sangat berharga karena memastikan independensi pengobatan dari hasil yang potensial. Itulah bagaimana hal itu mengarah pada perkiraan yang tidak bias dari efek pengobatan rata-rata. Tetapi skema penugasan lain juga dapat secara sistematis memastikan independensi pengobatan dari hasil yang potensial. Jadi mengapa kita perlu penugasan acak? Dengan kata lain, apa keuntungan penugasan acak dari skema penugasan non-acak yang juga mengarah pada kesimpulan yang tidak bias?
Biarkan menjadi vektor tugas perawatan di mana setiap elemen adalah 0 (unit tidak ditugaskan untuk perawatan) atau 1 (unit yang ditugaskan untuk perawatan). Dalam sebuah artikel JASA , Angrist, Imbens, dan Rubin (1996, 446-47) mengatakan bahwa penugasan perawatan adalah acak jika untuk semua \ mathbf {c} dan \ mathbf {c'} sedemikian rupa sehingga \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , dengan \ iota adalah a vektor kolom dengan semua elemen sama dengan 1.
Dengan kata lain, klaimnya adalah bahwa penugasan adalah acak jika setiap vektor penugasan yang mencakup penugasan untuk perawatan adalah sama mungkinnya dengan vektor lain yang mencakup penugasan untuk penangan.
Tetapi, untuk memastikan independensi hasil potensial dari penugasan pengobatan, cukup untuk memastikan bahwa setiap unit dalam penelitian ini memiliki probabilitas penugasan yang sama untuk pengobatan. Dan itu dapat dengan mudah terjadi bahkan jika sebagian besar vektor penugasan pengobatan memiliki probabilitas nol untuk dipilih. Artinya, itu dapat terjadi bahkan di bawah penugasan non-acak.
Berikut ini sebuah contoh. Kami ingin menjalankan percobaan dengan empat unit di mana tepatnya dua diperlakukan. Ada enam kemungkinan vektor penugasan:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
di mana digit pertama di setiap angka menunjukkan apakah unit pertama dirawat, digit kedua menunjukkan apakah unit kedua dirawat, dan seterusnya.
Misalkan kita menjalankan percobaan di mana kita mengecualikan kemungkinan penugasan vektor 3 dan 4, tetapi di mana masing-masing vektor lainnya memiliki peluang yang sama (25%) untuk dipilih. Skema ini bukan tugas acak dalam arti AIR. Tetapi dengan harapan, hal itu mengarah pada perkiraan yang tidak bias dari efek pengobatan rata-rata. Dan itu bukan kecelakaan. Skema penugasan apa pun yang memberikan peluang yang sama kepada subyek untuk penugasan terhadap pengobatan akan memungkinkan estimasi ATE yang tidak bias.
Jadi: mengapa kita perlu penugasan acak dalam arti AIR? Argumen saya berakar pada inferensi pengacakan; jika orang berpikir sebaliknya dalam hal inferensi berbasis model, apakah definisi AIR tampak lebih dapat dipertahankan?
sumber
Jawaban:
Ini menindaklanjuti komentar gung. Keseluruhan efek pengobatan rata-rata bukan itu intinya.
Misalkan Anda memiliki kasus diabetes baru di mana subjeknya berusia antara dan , dan pasien diabetes baru di atas . Anda ingin menetapkan setengah untuk perawatan. Mengapa tidak melempar koin, dan pada kepala, merawat semua pasien muda, dan pada ekor, merawat semua pasien yang lebih tua? Masing-masing akan memiliki1000 5 15 1000 30 50% kesempatan untuk dipilih dari perawatan, jadi ini tidak akan membiaskan hasil rata-rata dari perawatan, tetapi itu akan membuang banyak informasi. Tidak mengherankan jika diabetes remaja atau pasien yang lebih muda ternyata merespons jauh lebih baik atau lebih buruk daripada pasien yang lebih tua dengan tipe II atau diabetes gestasional. Efek pengobatan yang diamati mungkin tidak bias tetapi, misalnya, itu akan memiliki standar deviasi yang jauh lebih besar daripada yang akan terjadi melalui penugasan acak, dan meskipun sampel besar Anda tidak akan bisa berkata banyak. Jika Anda menggunakan penugasan acak, maka dengan probabilitas tinggi sekitar kasus di setiap kelompok umur akan mendapatkan pengobatan, sehingga Anda akan dapat membandingkan pengobatan dengan tidak ada perawatan dalam setiap kelompok umur. 500
Anda mungkin bisa melakukan lebih baik daripada menggunakan penugasan acak. Jika Anda memperhatikan faktor yang menurut Anda dapat memengaruhi respons terhadap pengobatan, Anda mungkin ingin memastikan bahwa subjek dengan atribut itu terbagi lebih rata daripada yang akan terjadi melalui penugasan acak. Tugas acak memungkinkan Anda melakukannya dengan cukup baik dengan semua faktor secara bersamaan, sehingga Anda dapat menganalisis banyak pola yang mungkin terjadi setelahnya.
sumber
Dalam contoh Anda, Anda dapat meninggalkan 2 dan 5 juga dan tidak bertentangan dengan diri Anda sendiri. Pada level item masih ada peluang yang sama untuk menjadi 1 atau 0 ketika ada peluang 1: 1 untuk memilih 1 atau 6. Tapi, sekarang apa yang Anda lakukan dengan menghapus 3 dan 4 menjadi lebih jelas.
sumber
Berikut ini salah satu dari variabel yang mengintai atau membingungkan: waktu (atau penyimpangan instrumental, efek penyimpanan sampel, dll.).
Jadi ada argumen yang menentang pengacakan (seperti yang dikatakan Douglas: Anda mungkin melakukan lebih baik daripada pengacakan). Misalnya, Anda dapat mengetahui sebelumnya bahwa Anda ingin kasing Anda seimbang dari waktu ke waktu. Seperti yang Anda ketahui sebelumnya bahwa Anda ingin memiliki jenis kelamin dan usia yang seimbang.
Dengan kata lain, jika Anda ingin secara manual memilih salah satu dari 6 skema Anda, saya akan mengatakan bahwa 1100 (atau 0011) adalah pilihan yang jelas buruk . Perhatikan bahwa kemungkinan pertama yang Anda buang adalah yang paling seimbang dalam waktu ... Dan yang terburuk dua yang tersisa setelah John mengusulkan untuk membuang juga 2 dan 5 (yang tidak Anda protes).
Dengan kata lain, intuisi Anda yang skema "bagus" sayangnya mengarah ke desain eksperimental yang buruk (IMHO ini cukup umum; mungkin hal-hal yang dipesan terlihat lebih baik - dan yang pasti lebih mudah untuk melacak urutan logis selama percobaan).
Anda mungkin dapat melakukan lebih baik dengan skema non-acak, tetapi Anda juga dapat melakukan jauh lebih buruk. IMHO, Anda harus dapat memberikan argumen fisik / kimia / biologis / medis / ... untuk skema non-acak tertentu yang Anda gunakan, jika Anda menggunakan skema non-acak.
sumber