Saya menggunakan model regresi Poisson untuk menghitung data dan saya bertanya-tanya apakah ada alasan untuk tidak menggunakan kesalahan standar yang kuat untuk estimasi parameter? Saya khususnya prihatin karena beberapa perkiraan saya tanpa robust tidak signifikan (misalnya, p = 0,13) tetapi dengan robust signifikan (p <0,01).
Dalam SAS, ini tersedia dengan menggunakan pernyataan berulang di proc genmod
(misalnya, repeated subject=patid;
). Saya telah menggunakan http://www.ats.ucla.edu/stat/sas/dae/poissonreg.htm sebagai contoh yang mengutip makalah oleh Cameron dan Trivedi (2009) untuk mendukung penggunaan kesalahan standar yang kuat.
Saya akan membedakan analisis menggunakan model berbasis versus kesalahan standar yang kuat dengan merujuk yang terakhir sebagai "GEE" yang sebenarnya merupakan definisi yang dapat dipertukarkan. Selain penjelasan fantastis Scortchi:
GEE dapat "bias" dalam sampel kecil, yaitu 10-50 subjek: (Lipsitz, Laird, dan Harrington, 1990; Emrich dan Piedmonte, 1992; Sharples dan Breslow, 1992; Lipsitz et al., 1994; Qu, Piedmonte, dan Williams, 1994; Gunsolley, Getchell, dan Chinchilli, 1995; Sherman dan le Cessie, 1997.) Ketika saya mengatakan bahwa GEE bias apa yang saya maksudkan adalah bahwa perkiraan kesalahan standar dapat berupa konservatif atau antikonservatif karena jumlah sel yang kecil atau nol , tergantung pada nilai-nilai yang cocok menunjukkan perilaku ini dan seberapa konsisten mereka dengan tren keseluruhan dari model regresi.
Secara umum, ketika model parametrik ditentukan dengan benar, Anda masih mendapatkan perkiraan kesalahan standar yang benar dari CI berbasis model, tetapi seluruh titik penggunaan GEE adalah untuk mengakomodasi "jika" yang sangat besar. GEE memungkinkan ahli statistik untuk hanya menentukan model probabilitas kerja untuk data, dan parameter (alih-alih ditafsirkan dalam kerangka parametrik ketat) dianggap sebagai jenis "saringan" yang dapat menghasilkan nilai yang dapat direproduksi terlepas dari yang mendasari, pembuatan data yang tidak diketahui mekanisme. Ini adalah jantung dan jiwa dari analisis semi-parametrik, yang menjadi contoh GEE.
GEE juga menangani sumber kovarisasi yang tidak terukur dalam data, bahkan dengan spesifikasi matriks korelasi independen. Ini karena penggunaan matriks kovarians berbasis empiris daripada model. Dalam pemodelan Poisson, misalnya, Anda mungkin tertarik pada tingkat kesuburan salmon sampel dari berbagai aliran. Ova yang dipanen dari ikan betina mungkin memiliki distribusi Poisson yang mendasarinya, tetapi variasi genetik yang terdiri dari heretibilitas bersama dan sumber daya yang tersedia di aliran tertentu mungkin membuat ikan di dalam aliran tersebut lebih mirip daripada di antara aliran lainnya. GEE akan memberikan perkiraan kesalahan standar populasi yang benar selama laju pengambilan sampel konsisten dengan proporsi populasi mereka (atau dengan cara lain distratifikasi).
sumber
Anda melakukan tes null equidispersion. Ini adalah regresi OLS tambahan sederhana. Ada deskripsi di halaman 670 tentang Cameron dan Trivedi. Dengan overdispersion besar, kesalahan standar sangat kempes, jadi saya akan sangat waspada terhadap hasil yang bergantung pada VCE yang tidak kuat ketika ada overdispersion. Dengan penyebaran rendah, yang terjadi adalah sebaliknya, yang terdengar seperti skenario yang Anda alami.
sumber