Dalam studi longitudinal, hasil dari unit berulang kali diukur pada titik waktu dengan total pengukuran tetap kali (tetap = pengukuran pada unit diambil pada waktu yang sama). i t m
Unit ditugaskan secara acak baik untuk perawatan, , atau ke kelompok kontrol, . Saya ingin memperkirakan dan menguji efek rata-rata pengobatan, yaitu mana harapan diambil berdasarkan waktu dan individu. Saya mempertimbangkan untuk menggunakan model multilevel (efek campuran) fixed-chance untuk tujuan ini:G = 0 A T E = E ( Y | G = 1 ) - E ( Y | G = 0 ) ,
dengan mencegat, yang , mencegat acak di seluruh unit, dan sisa.β A T E u e
Sekarang saya sedang mempertimbangkan model alternatif
yang berisi efek tetap untuk setiap kesempatan mana dummy jika dan lainnya. Selain itu model ini berisi interaksi antara pengobatan dan waktu dengan parameter . Jadi model ini memperhitungkan bahwa efek mungkin berbeda antar waktu. Ini informatif dalam dirinya sendiri, tetapi saya percaya bahwa itu juga harus meningkatkan ketepatan estimasi parameter, karena heterogenitas dalam diperhitungkan. t d t = 1 j = t 0 γ G Y
Namun, dalam model ini koefisien tampaknya tidak sama dengan lagi. Sebaliknya itu mewakili ATE pada kesempatan pertama ( ). Jadi estimasi mungkin lebih efisien daripada tetapi tidak mewakili lagi. ATE
Pertanyaan saya adalah :
- Apa cara terbaik untuk memperkirakan efek pengobatan dalam desain studi longitudinal ini?
- Apakah saya harus menggunakan model 1 atau adakah cara untuk menggunakan (mungkin lebih efisien) model 2?
- Apakah ada cara untuk membuat memiliki interpretasi dan pada penyimpangan khusus (misalnya menggunakan pengkodean efek)? ATEγ
Jawaban:
Menjawab pertanyaan Anda "Saya ingin tahu cara mengeluarkan ATE dari model 2" di komentar:
Pertama-tama, dalam model 2 Anda, tidak semua dapat diidentifikasi yang mengarah ke masalah kekurangan peringkat dalam matriks desain. Kita perlu menjatuhkan satu level, misalnya dengan asumsi untuk . Artinya, menggunakan pengkodean kontras dan menganggap efek pengobatan pada periode 1 adalah 0. Dalam R, itu akan mengkode istilah interaksi dengan efek pengobatan pada periode 1 sebagai tingkat referensi, dan itu juga alasan mengapa memiliki interpretasi efek pengobatan pada periode 1. Dalam SAS, ia akan mengkode efek pengobatan pada periode sebagai level referensi, kemudian memiliki interpretasi efek pengobatan pada periodeγj γj=0 j=1 β~ m β~ m , bukan periode 1 lagi.
Dengan asumsi kontras dibuat dengan cara R, maka koefisien diperkirakan untuk setiap istilah interaksi (saya masih akan menyatakan ini dengan , meskipun tidak persis apa yang Anda tetapkan dalam model Anda) memiliki interpretasi perbedaan efek pengobatan antara periode waktu dan periode waktu 1. Nyatakan ATE pada setiap periode , lalu untuk . Karenanya estimator untuk adalah . (Mengabaikan perbedaan notasi antara true parameter dan estimator itu sendiri karena kemalasan) Dan tentu saja Andaγj j ATEj γj=ATEj−ATE1 j=2,…,m ATEj β~+γj ATE=β=1m∑mj=1ATEj=β~+(β~+γ2)+⋯+(β~+γm)m=β~+1m(γ2+⋯+γm) .
Saya melakukan simulasi sederhana dalam R untuk memverifikasi ini:
Dan hasilnya memverifikasi ini:
Saya tidak tahu bagaimana cara langsung mengubah pengkodean kontras dalam model 2 di atas, jadi untuk menggambarkan bagaimana seseorang dapat langsung menggunakan fungsi linear dari istilah interaksi, serta cara mendapatkan kesalahan standar, saya menggunakan paket multcomp:
Dan inilah hasilnya:
Saya pikir kesalahan standar diperoleh oleh dengan menjadi bentuk kombinasi linear di atas dan estimasi varians-kovarians matriks dari koefisien dari model 3. wVwV^wT−−−−−√ w V
Pengodean deviasi
Cara lain untuk membuat memiliki interpretasi langsung dari adalah dengan menggunakan pengkodean deviasi , sehingga kovariat selanjutnya mewakili perbandingan : ATEATEj-ATEβ~ ATE ATEj−ATE
Keluaran:
sumber
beta_t
Untuk pertanyaan pertama, pemahaman saya adalah bahwa cara-cara "mewah" hanya diperlukan ketika tidak segera jelas bahwa pengobatan tidak tergantung pada hasil yang potensial. Dalam kasus ini, Anda perlu berdebat bahwa beberapa aspek data memungkinkan untuk perkiraan tugas acak untuk pengobatan, yang membawa kita ke variabel instrumental, diskontinuitas regresi, dan sebagainya.
Dalam kasus Anda, unit secara acak ditugaskan untuk pengobatan, sehingga tampaknya dapat dipercaya bahwa pengobatan tidak tergantung pada hasil potensial. Maka kita bisa menyederhanakannya: perkirakan model 1 dengan kuadrat terkecil biasa, dan Anda memiliki perkiraan ATE yang konsisten. Karena unit secara acak ditugaskan untuk pengobatan, ini adalah salah satu dari beberapa kasus di mana asumsi efek-acak dapat dipercaya.
sumber