Pilihan bobot jalur dalam model konseptual SEM untuk kembar identik & fraternal menggunakan openMx

10

Saya meninjau paket R OpenMx untuk analisis epidemiologi genetik untuk mempelajari cara menentukan dan menyesuaikan model SEM. Saya baru dalam hal ini, jadi bersabarlah. Saya mengikuti contoh di halaman 59 dari Panduan Pengguna OpenMx . Di sini mereka menggambar model konseptual berikut:

Model SEM untuk kembar identik & persaudaraan

Dan dalam menentukan lintasan, mereka menetapkan bobot simpul "satu" laten ke simpul bmi terwujud "T1" dan "T2" menjadi 0,6 karena:

Jalur utama yang menarik adalah mereka dari masing-masing variabel laten ke masing-masing variabel yang diamati. Ini juga diperkirakan (dengan demikian semua dibebaskan), dapatkan nilai awal 0,6 dan label yang sesuai.

# path coefficients for twin 1
mxPath(
  from=c("A1","C1","E1"),
  to="bmi1",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

# path coefficients for twin 2
mxPath(
  from=c("A2","C2","E2"),
  to="bmi2",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

Nilai 0,6 berasal dari estimasi kovarians bmi1dan bmi2(dari pasangan kembar mono zygotik yang ketat ). Saya punya dua pertanyaan:

  1. Ketika mereka mengatakan bahwa path diberi nilai "awal" 0,6 apakah ini seperti menetapkan rutin integrasi numerik dengan nilai awal, seperti dalam estimasi GLM?

  2. Mengapa nilai ini diestimasi secara ketat dari si kembar monozigot?

AdamO
sumber

Jawaban:

4

Untuk menjawab 2 poin Anda:

1) Ya, tepat - nilai awal hanya menentukan di mana algoritma akan memulai proses optimasi. Sebagian besar paket perangkat lunak sebenarnya menentukan nilai awal mereka sendiri secara default, dan pengguna perlu mencoba memasukkan nilai yang berbeda hanya ketika masalah terjadi selama estimasi. Dari pengalaman saya, nilai-nilai awal yang paling masuk akal akan dilakukan, dan tidak akan mengubah model akhir di mana algoritma konvergen.

2) Nilai 0,6 adalah nilai awal bukan untuk mencegat T1 dan T2 (jalur antara "satu" dan T1 & T2), tetapi nilai awal untuk memuat faktor yang menghubungkan setiap variabel laten (A, C, E ) ke indikator mereka T1 atau T2. Ini ditunjukkan oleh fakta bahwa jalan masuk from=c("A1","C1","E1"), to="bmi1"dalam kasus pertama, dan from=c("A2","C2","E2"), to="bmi2"dalam kasus kedua.

Adapun nilai spesifik "0,6": Saya tidak dapat menemukan dalam dokumentasi di mana mereka menyebutkan mengambil nilai ini berdasarkan subkelompok kembar monozigot; dan sebenarnya, estimasi parameter ini (memuat faktor untuk 3 variabel laten) tidak dapat langsung dihitung dari sampel, karena menurut definisi, variabel laten ini tidak teramati (mereka laten). Seperti yang saya sebutkan pada poin # 1, jarang akan pilihan antara dua nilai yang masuk akal mempengaruhi estimasi parameter dari model terkonvergensi, jadi dugaan saya adalah bahwa mereka hanya memilih satu dari banyak nilai yang masuk akal untuk memuat faktor-faktor ini sebagai nilai awal. Apakah nilai ini memang berasal dari estimasi kovarians antara bmi1 dan bmi2 dalam subkelompok monozigot-kembar hanya tidak relevan, karena nilai awal yang masuk akal apa pun harus mengarah pada algoritma untuk konvergen pada nilai akhir yang sama, mungkin dengan beberapa perbedaan dalam waktu komputasi. (Dan saran saya untuk meyakinkan diri sendiri adalah: coba! Coba beberapa nilai awal dan bandingkan perkiraan parameter dari model yang terkonvergensi.)

Sebagai catatan umum, saya akan menunjukkan bahwa pilihan nilai awal untuk setiap estimasi parameter menjadi SANGAT penting jika argumen freediatur ke FALSE, karena nilai awal akan secara efektif menjadi nilai estimasi parameter dalam model akhir (itu tidak akan diestimasi; diperbaiki sebelum estimasi).

Patrick Coulombe
sumber