Saya bertanya-tanya apa perbedaan antara GLM campuran dan tidak dicampur. Misalnya, di SPSS menu tarik turun memungkinkan pengguna untuk masuk:
analyze-> generalized linear models-> generalized linear models
&analyze-> mixed models-> generalized linear
Apakah mereka menangani nilai-nilai yang hilang secara berbeda?
Variabel dependen saya adalah biner dan saya memiliki beberapa variabel independen kategori dan kontinu.
mixed-model
generalized-linear-model
glmm
gee
pengguna9203
sumber
sumber
Jawaban:
Munculnya model linier umum telah memungkinkan kami untuk membangun model tipe regresi data ketika distribusi variabel respon tidak normal - misalnya, ketika DV Anda adalah biner. (Jika Anda ingin tahu lebih banyak tentang GLiMs, saya menulis jawaban yang cukup luas di sini , yang mungkin berguna meskipun konteksnya berbeda.) Namun, GLiM, misalnya model regresi logistik, mengasumsikan bahwa data Anda independen . Misalnya, bayangkan sebuah penelitian yang meneliti apakah seorang anak menderita asma. Setiap anak berkontribusi satudata menunjukkan penelitian - mereka memiliki asma atau tidak. Namun, terkadang data tidak independen. Pertimbangkan penelitian lain yang meneliti apakah seorang anak menderita flu di berbagai titik selama tahun sekolah. Dalam hal ini, setiap anak berkontribusi banyak poin data. Pada suatu waktu seorang anak mungkin pilek, kemudian mereka mungkin tidak, dan masih kemudian mereka mungkin pilek lagi. Data ini tidak independen karena mereka berasal dari anak yang sama. Untuk menganalisis data ini dengan tepat, kita perlu memperhitungkan ketidak-independenan ini. Ada dua cara: Salah satu caranya adalah dengan menggunakan persamaan estimasi umum (yang tidak Anda sebutkan, jadi kami akan lewati). Cara lain adalah dengan menggunakan model campuran linier umum. GLiMM dapat menjelaskan non-kemerdekaan dengan menambahkan efek acak (seperti catatan @MichaelChernick). Dengan demikian, jawabannya adalah bahwa pilihan kedua Anda adalah untuk data berulang yang tidak normal (atau tidak independen). (Saya harus menyebutkan, sesuai dengan komentar @ Makro ini, yang umum- terwujud linear model campuran Namun termasuk model linear sebagai kasus khusus dan dengan demikian dapat digunakan dengan data terdistribusi normal., Dalam penggunaan khas berkonotasi jangka data non-normal.)
Pembaruan: (OP telah bertanya tentang GEE juga, jadi saya akan menulis sedikit tentang bagaimana ketiganya berhubungan satu sama lain.)
Berikut ini gambaran dasar:
Karena Anda memiliki beberapa uji coba per peserta, data Anda tidak independen; seperti yang Anda catat dengan benar, "real di dalam satu peserta cenderung lebih mirip daripada dibandingkan dengan seluruh kelompok". Karena itu, Anda harus menggunakan GLMM atau GEE.
Masalahnya, kemudian, adalah bagaimana memilih apakah GLMM atau GEE akan lebih sesuai untuk situasi Anda. Jawaban untuk pertanyaan ini tergantung pada subjek penelitian Anda - khususnya, target kesimpulan yang ingin Anda buat. Seperti yang saya nyatakan di atas, dengan GLMM, beta-beta tersebut memberi tahu Anda tentang efek satu unit perubahan pada kovariat Anda pada peserta tertentu, dengan karakteristik masing-masing. Di sisi lain dengan GEE, beta memberi tahu Anda tentang efek satu unit perubahan dalam kovariat Anda pada rata-rata tanggapan seluruh populasi yang bersangkutan. Ini adalah perbedaan yang sulit untuk dipahami, terutama karena tidak ada perbedaan dengan model linier (dalam hal ini keduanya adalah hal yang sama).
Pertanyaan apakah Anda harus menggunakan GLMM atau GEE adalah pertanyaan fungsi mana yang ingin Anda perkirakan. Jika Anda ingin tahu tentang kemungkinan kelulusan siswa tertentu (jika, katakanlah, Anda adalah siswa, atau orang tua siswa), Anda ingin menggunakan GLMM. Di sisi lain, jika Anda ingin tahu tentang pengaruhnya terhadap populasi (jika, misalnya, Anda adalah guru , atau kepala sekolah), Anda ingin menggunakan GEE.
Untuk diskusi lain yang lebih rinci secara matematis dari bahan ini, lihat jawaban ini oleh @ Macro.
sumber
Kuncinya adalah pengenalan efek acak. Tautan Gung menyebutkannya. Tapi saya pikir itu seharusnya disebutkan secara langsung. Itulah perbedaan utama.
sumber
Saya sarankan Anda juga memeriksa jawaban dari pertanyaan yang saya tanyakan beberapa waktu lalu:
General Linear Model vs. Generalized Linear Model (dengan fungsi tautan identitas?)
sumber