Saya sedang melakukan penelitian tentang hubungan antara urutan kelahiran seseorang dan risiko obesitas di kemudian hari menggunakan data dari beberapa kohort kelahiran 1 tahun (mis. Http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).
Tantangan utama adalah bahwa urutan kelahiran terkait dengan fitur-fitur lain seperti usia ibu, jumlah saudara kandung yang lebih muda dan / atau lebih tua, dan jarak kelahiran, yang juga dapat mempengaruhi hasil melalui mekanisme yang berbeda. Selanjutnya, segala pengaruh hal-hal ini terhadap risiko obesitas nanti dapat dimodifikasi oleh komposisi jenis kelamin saudara kandung, termasuk "anak indeks" (peserta dalam kelompok kelahiran).
Untuk setiap anak indeks, orang dapat menggambar garis waktu yang menunjukkan semua kelahiran dalam keluarga, dengan usia ibu pada variabel waktu.
Saya mencoba mengidentifikasi metode untuk menganalisis jenis data ini, di mana urutan, waktu, dan sifat kejadian semua mungkin penting. Saya mengajukan pertanyaan ini di sini karena keragaman aplikasi yang digunakan anggota - Saya berharap seseorang memiliki beberapa saran langsung yang akan membuat saya lebih lama untuk mengidentifikasi sendiri. Setiap dorongan ke arah yang benar akan sangat dihargai.
Pertanyaan terkait: Bagaimana saya harus menganalisis data tentang interval kelahiran perempuan?
Jawaban:
Anda mungkin mempertimbangkan untuk menggunakan model bertingkat (regresi berganda) untuk memperkirakan antara dan di dalam efek keluarga. Salah satu strategi yang mungkin adalah dengan menggunakan pendekatan pembangunan model hierarkis yang terencana. Misalnya, uji setiap calon penaksir dalam model univariat. Jika antara efek keluarga menghapus efek urutan kelahiran, maka itu akan sangat menyarankan urutan kelahiran tidak penting tetapi pengaruh lainnya. Contoh kutipan untuk efek urutan kelahiran ini pada IQ:
Saya harap ini membantu.
sumber
Saya mendekati ini sebagai pertanyaan statistik dan tidak memiliki pengetahuan khusus tentang masalah medis.
Melihat artikel yang Anda rujuk, saya melihat bahwa satu kelompok berisi 970 orang. Jika Anda memiliki data pada beberapa kohort dengan ukuran yang kira-kira sama, maka ukuran keseluruhan dataset Anda menawarkan kesempatan untuk memilih subset yang cukup besar di mana garis waktu masing-masing individu memenuhi kondisi tertentu. Misalnya, subset mungkin mencakup, katakanlah, semua individu pria dengan usia ibu 25-29. Regresi, untuk subset seperti itu, dari ukuran yang sesuai dari obesitas di kemudian hari terhadap urutan kelahiran akan menghilangkan efek yang mungkin terjadi pada obesitas di kemudian hari dari perbedaan jenis kelamin anak indeks dan sebagian besar menghilangkan segala kemungkinan dampak usia ibu.
Tidak mudah untuk memperluas pendekatan ini ke jenis kelamin saudara kandung karena jika satu syarat untuk subset adalah, katakanlah, bahwa anak indeks memiliki saudara perempuan yang lebih tua, yang menyiratkan bahwa anak indeks itu sendiri bukan anak tertua, mempersempit kisaran. dari variabel independen dalam regresi. Namun, satu jalan memutar untuk menentukan kondisi menggunakan "jika ada". Misalnya, subset dapat didefinisikan untuk memasukkan semua individu pria dengan usia ibu 25-29 dan dengan saudara yang lebih tua, jika ada, semua wanita. Subset seperti itu masih akan mencakup individu dengan urutan kelahiran apa pun.
Jika himpunan bagian didefinisikan oleh sekumpulan kondisi yang terlalu rumit, maka jumlah individu yang dikandungnya mungkin sangat kecil sehingga estimasi koefisien yang dihasilkan akan terlalu tidak tepat untuk berguna. Jika pendekatan ini diadopsi, mungkin akan ada kebutuhan untuk trade-off penilaian, dalam mendefinisikan himpunan bagian, antara menghilangkan efek sebanyak mungkin dan termasuk individu yang cukup untuk menghasilkan hasil yang bermanfaat.
sumber
Saya akan menyarankan analisis data fungsional tetapi saya curiga Anda mungkin memiliki banyak keluarga dengan terlalu sedikit anak untuk mendapatkan perkiraan yang masuk akal. Teruskan dan baca saja, karena ini memenuhi kebutuhan Anda. Mungkin seseorang sudah menggunakannya dengan data serupa.
Jika Anda tidak ingin melakukan sesuatu yang sangat tidak parametrik seperti itu, Anda harus menggunakan keahlian klinis Anda untuk mengurangi dimensi data. Misalnya, satu variabel dalam model Anda bisa jumlah anak, yang lain bisa jumlah rata-rata tahun antara anak-anak, dan sebagainya. Jika ada efek dalam variabel-variabel ini, itu mungkin muncul bahkan jika Anda belum menentukan bentuk fungsional dengan segera. Pembuatan model berbasis pengetahuan lebih lanjut memungkinkan Anda untuk membangun model yang sangat prediktif - pastikan Anda menyimpan set validasi!
sumber