Saya memiliki data survei kategoris tentang sikap masyarakat terhadap bidang kebijakan tertentu dari 13 negara. Variabel respons bersifat kategoris, dan mencakup 4 jawaban berbeda yang tidak dapat dipesan.
Saya ingin membangun multi-level random-intercept dan random-slope model multinomial. Masalahnya adalah, bahwa jumlah kasus level-2 hanya 13, dan modelnya tidak bertemu, setidaknya tidak dalam bentuk multinomialnya.
Jadi, sebagai pilihan terbaik kedua, saya berpikir tentang pengodean ulang variabel respon ke dalam bentuk biner, menjalankan serangkaian regresi logistik bertingkat, dan kemudian menggunakan probabilitas yang diprediksi untuk menunjukkan bagaimana probabilitas bahwa kategori tertentu yang dipilih akan tergantung pada variabel penjelas saya. Ini, tampaknya, hanyalah pilihan terbaik kedua. Saya ingin tahu apa risiko yang mungkin timbul dari mengambil pendekatan ini, dan keberatan apa (dari pengulas, penyelia, dll.) Yang harus saya harapkan.
sumber
Jawaban:
Pilihan antara satu multinomial dan serangkaian regresi logistik dalam banyak kasus relatif buatan. Karena dalam kedua pendekatan Anda memilih satu kategori dasar (referensi) yang berkaitan dengan rasio odds semua kategori lainnya dinyatakan, biasanya tidak masalah jika Anda memiliki satu atau yang lain jika kategori referensi tetap sama. Kekurangan terbesar adalah bahwa Anda tidak dapat menguji batasan parameter yang simultan di seluruh model logistik, yang agak lurus ke depan dalam kasus multinomial.
Namun demikian saya menyarankan untuk tidak menggunakan efek acak dengan 13 negara (unit level 2), lihat misalnya https://www.statmodel.com/download/SRM2012.pdf .
Alternatifnya adalah dengan menggunakan model efek tetap, di mana Anda memasukkan satu dummy per negara (minus 1). Kerugian terbesar dari prosedur ini bahwa pengujian efek tingkat makro tidak layak. jika Anda tidak memiliki hipotesis dalam hal ini saya akan menggunakan model multinomial efek tetap.
sumber
Saya akan mendorong Anda untuk menjalankan analisis ini dalam satu model (dalam AMOS) dan saya tidak berpikir struktur data Anda bermasalah (lihat misalnya: Maas, CJM & Hox, JJ (2005) Ukuran sampel yang cukup untuk pemodelan multilevel. Metodologi, 1 , 86-92.). Ketika Anda menjalankan beberapa model pada dataset yang sama, Anda meningkatkan kemungkinan membuat kesalahan tipe I (minimal Anda harus menggunakan Koreksi Bonferroni; yang dianggap sebagai teknik konservatif).
sumber