Apakah setiap model log-linear memiliki regresi logistik yang setara sempurna?

8

Saya mencoba menyesuaikan model log-linear dengan sejumlah besar variabel dari data survei. Ada beberapa alasan yang mungkin lebih cocok untuk memasukkan regresi logistik ke data tersebut. Beberapa pihak berwenang menyatakan bahwa ini setara. Namun, saya punya beberapa alasan untuk meragukan hal ini.

  1. Model log-linear memperlakukan semua variabel secara setara, sedangkan regresi logistik mengharuskan satu variabel diidentifikasi sebagai variabel respons.
  2. Dalam konteks kuadrat-terkecil, umumnya tidak berlaku untuk Y = a + bX + ε versus X = c + dY + ε parameter d bahkan kira-kira sama dengan 1 / b. Ini karena persamaan pertama meminimalkan kesalahan vertikal, sedangkan yang kedua meminimalkan kesalahan horisontal. Ini akan sama hanya jika kesalahan simetris di sekitar garis taksiran. Jadi saya khawatir ini mungkin benar dari regresi logistik juga. (2) sebenarnya hanya bentuk spesifik dari (1), yaitu kemungkinan asimetri dalam format regresi dari pilihan variabel tertentu sebagai respons.

  3. Jika semua variabel dalam model log-linear terlibat dalam satu atau lebih istilah interaksi, saya tidak melihat bagaimana regresi logistik dapat setara. Bagaimana orang akan mengungkapkan interaksi di mana variabel respon terlibat dalam konteks regresi logistik?

Menanggapi Bill Huber, saya menggunakan model log-linear dengan pengertian yang jauh lebih terbatas daripada Wikipedia. Saya mengacu pada model data penghitungan kategoris atau ordinal, disusun dalam tabel, di mana koefisien adalah jumlah tabel total, jumlah marginal untuk setiap faktor dibagi dengan jumlah tabel total (berfungsi sebagai proksi probabilitas), dan berbagai istilah interaksi. Ini adalah arti yang digunakan dalam Agresti, "Analisis Data Kategorikal", antara lain.

andrewH
sumber
Pemahaman saya tentang "model loglinear" - yang cukup selaras dengan definisi Wikipedia , meskipun sedikit lebih umum - tidak memungkinkan saya untuk memahami pertanyaan ini. Bisakah Anda memberi tahu kami apa arti istilah ini bagi Anda?
whuber
2
Wikipedia menyebutnya analisis loglinear: en.wikipedia.org/wiki/Loglinear_analysis
Jeremy Miles
1
Ada beberapa bentuk analisis loglinear - umum, logit, dll. Analisis loglinear logit untuk situasi ketika Anda memiliki variabel dependen dan beberapa prediktor. Sejauh yang saya tahu, ini memberikan hasil yang sama (estimasi parameter) dengan regresi logistik nominal.
ttnphns

Jawaban:

4

Jawabannya adalah tidak'. Model loglinear lebih umum daripada model regresi logistik. Lihat Fienberg, 1980, Analisis Data Klasifikasi Lintas-Klasifikasi, bagian 6.2 tentang cara menentukan model loglinear sehingga sesuai dengan regresi logistik.

Sebenarnya kebalikannya benar: Jika semua variabel kategori, maka setiap model regresi logistik sesuai dengan beberapa model loglinear.

Stef van Buuren
sumber
Jadi, ini yang saya pikirkan, tapi bukan yang saya harapkan. Dalam R, yang merupakan alat utama yang saya gunakan, ada beberapa paket kontribusi atau rutinitas yang tersedia untuk menyesuaikan desain sampling survei yang kompleks untuk model lm dan GLM. Saya belum menemukan sesuatu yang setara untuk model log-linear.
andrewH
Saya tidak tahu apakah ini berguna untuk keperluan Anda, tetapi fungsi loglm () dari MASS dapat ditampung dengan model linear log. Juga, Anda mungkin ingin memeriksa paket ACD.
Stef van Buuren
Juga, dengan GLM Poisson Anda dapat memuat model log-linear. Lihat Agresti: Analisis Data Kategori Bagian 8.6.7.
Momo