Saya memiliki dataset yang berisi ~ 7.500 tes darah dari ~ 2.500 orang. Saya mencoba mencari tahu apakah variabilitas dalam tes darah meningkat atau menurun dengan waktu antara dua tes. Sebagai contoh - Saya mengambil darah Anda untuk tes dasar, kemudian segera mengambil sampel kedua. Enam bulan kemudian, saya mengambil sampel lain. Seseorang mungkin mengharapkan perbedaan antara baseline dan tes pengulangan langsung menjadi lebih kecil daripada perbedaan antara baseline dan tes enam bulan.
Setiap titik pada plot di bawah ini mencerminkan perbedaan antara dua tes. X adalah jumlah hari antara dua tes; Y adalah ukuran perbedaan antara dua tes. Seperti yang Anda lihat, tes tidak didistribusikan secara merata di sepanjang X - penelitian ini tidak dirancang untuk menjawab pertanyaan ini, sungguh. Karena titik-titik tersebut sangat banyak ditumpuk pada rata-rata, saya telah menyertakan 95% (biru) dan 99% (merah) garis kuantil, berdasarkan pada jendela 28-hari. Ini jelas ditarik oleh poin yang lebih ekstrim, tetapi Anda mendapatkan idenya.
alt teks http://a.imageshack.us/img175/6595/diffsbydays.png
Sepertinya variabilitasnya cukup stabil. Jika ada, itu lebih tinggi ketika tes diulang dalam waktu singkat - itu sangat berlawanan dengan intuisi. Bagaimana saya bisa mengatasinya dengan cara yang sistematis, memperhitungkan berbagai n pada setiap titik waktu (dan beberapa periode tanpa tes sama sekali)? Ide-ide Anda sangat dihargai.
Hanya untuk referensi, ini adalah distribusi jumlah hari antara tes dan tes ulang:
alt teks http://a.imageshack.us/img697/6572/testsateachtimepoint.png
sumber
Jawaban:
Dari uraian Anda, saya tidak dapat melihat alasan untuk membedakan "tes awal" dari "sampel kedua" yang diambil langsung. Mereka hanya 2 pengukuran dasar dan varians (pada awal) dapat dihitung atas dasar itu. Akan lebih baik merencanakan rata-rata dari dua pengukuran dasar dibandingkan sampel "enam bulan" ketiga.
Masalahnya dengan sampel 6 bulan. Karena hanya satu sampel yang diambil pada titik ini, tidak ada cara untuk memperkirakan "variabilitas" pada titik ini, atau lebih tepatnya memisahkan variasi sampel dari perubahan longitudinal (nyata) dalam pembacaan TB.
Jika kita menganggap ini sebagai masalah analisis data longitudinal, kita mungkin akan memilih intersep acak (TB awal) dan kemiringan acak (agar sesuai dengan TB 6 bulan). Variabilitas pengambilan sampel akan diperkirakan dari dua pengukuran dasar dan kemiringan dari ukuran 6 bulan ketiga. Kami tidak dapat memperkirakan variabilitas pada 6 bulan tanpa asumsi distribusi yang kuat pada chnage selama enam bulan tersebut, seperti mengasumsikan tidak ada perubahan.
sumber