General Linear Model vs. Generalized Linear Model (dengan fungsi tautan identitas?)

25

Ini adalah posting pertama saya, jadi tolong tenangkan saya jika saya tidak mengikuti beberapa standar! Saya melakukan pencarian untuk pertanyaan saya dan tidak ada yang muncul.

Pertanyaan saya sebagian besar berkaitan dengan perbedaan praktis antara pemodelan linier umum (GLM) dan pemodelan linier umum (GZLM). Dalam kasus saya ini akan menjadi beberapa variabel kontinu sebagai kovariat dan beberapa faktor dalam ANCOVA, dibandingkan GZLM. Saya ingin memeriksa efek utama dari masing-masing variabel, serta satu interaksi tiga arah yang akan saya uraikan dalam model. Saya dapat melihat hipotesis ini diuji dalam ANCOVA, atau menggunakan GZLM. Sampai batas tertentu saya memahami proses matematika dan alasan di balik menjalankan model linear umum seperti ANCOVA, dan saya agak mengerti bahwa GZLM memungkinkan fungsi tautan yang menghubungkan model linier dan variabel dependen (ok, saya berbohong, mungkin saya tidak sangat mengerti matematika). Apa yang sebenarnya tidak saya lakukan t memahami apakah perbedaan praktis atau alasan untuk menjalankan satu analisis dan bukan yang lain ketika distribusi probabilitas yang digunakan dalam GZLM adalah normal (yaitu, fungsi tautan identitas?). Saya mendapatkan hasil yang sangat berbeda ketika saya menjalankan satu di atas yang lain. Bisakah saya menjalankan keduanya? Data saya agak tidak normal, tetapi berfungsi sampai batas tertentu baik di ANCOVA dan GZLM. Dalam kedua kasus hipotesis saya didukung, tetapi dalam GZLM nilai p "lebih baik".

Pikiran saya adalah bahwa ANCOVA adalah model linier dengan variabel dependen terdistribusi normal menggunakan fungsi tautan identitas, yang persis apa yang saya dapat masukan dalam GZLM, tetapi ini masih berbeda.

Tolong jelaskan pertanyaan-pertanyaan ini untuk saya, jika Anda bisa!


Berdasarkan jawaban pertama saya punya pertanyaan tambahan:

Jika mereka identik kecuali untuk uji signifikansi yang digunakan (yaitu, uji F vs Wald Chi Square), mana yang paling tepat untuk digunakan? ANCOVA adalah "metode masuk", tetapi saya tidak yakin mengapa uji F lebih disukai. Adakah yang bisa menjelaskan pertanyaan ini untuk saya? Terima kasih!

Behacad
sumber
Jawaban @ onestop baik; Saya membatalkannya sejak lama. Untuk mendapatkan pemahaman yang lebih jelas tentang hubungan antara model linier umum & model linier umum , ada baiknya Anda membaca jawaban saya di sini: perbedaan-antara-logit-dan-probit-model (walaupun ditulis dalam konteks yang berbeda) . Dengan asumsi kesalahan Anda terdistribusi secara normal, tetapi varians kesalahan tidak diketahui a-priori, tes & bahwa perangkat lunak akan kembali dengan ANCOVA akan benar; nilai p dari uji Wald akan terlalu rendah, kecuali jika N Anda sangat besar. tF
gung - Reinstate Monica

Jawaban:

23

Model linier umum yang menetapkan fungsi tautan identitas dan distribusi keluarga normal persis sama dengan model linear (umum). Jika Anda mendapatkan hasil yang sangat berbeda dari masing-masing, Anda melakukan sesuatu yang salah.

Perhatikan bahwa menentukan tautan identitas tidak sama dengan menentukan distribusi normal. Fungsi distribusi dan tautan adalah dua komponen berbeda dari model linier umum, dan masing-masing dapat dipilih secara terpisah dari yang lain (meskipun tautan tertentu berfungsi lebih baik dengan distribusi tertentu, sehingga sebagian besar paket perangkat lunak menentukan pilihan tautan yang diizinkan untuk setiap distribusi).

Beberapa paket perangkat lunak dapat melaporkan nilai berbeda ketika derajat sisa kebebasan kecil jika menghitungnya menggunakan distribusi normal dan chi-square asimptotik untuk semua model linier umum. Semua perangkat lunak akan melaporkan -values berdasarkan Student - dan Fisher -distributions untuk model linear umum, karena ini lebih akurat untuk derajat sisa kecil kebebasan karena mereka tidak bergantung pada asymptotics. Distribusi - dan Fisher's hanya berlaku untuk keluarga normal saja, meskipun beberapa lainnyahalhaltFtF perangkat lunak untuk model linier umum juga dapat menggunakan ini sebagai perkiraan ketika menyesuaikan keluarga lain dengan parameter skala yang diperkirakan dari data.

onestop
sumber
Terimakasih atas balasan anda! Saya senang mendengar jawaban Anda, karena itu asumsi asli saya. Saya diberitahu sebaliknya oleh seorang profesor di institusi saya, jadi saya benar-benar harus menggali. Saya menggunakan SPSS dan sekarang saya melihat bahwa estimasi parameter memang identik (misalnya, nilai B). Saya melihat sekarang bahwa yang membuat saya bingung pada awalnya adalah nilai p yang berbeda. Statistik ANCOVA didasarkan pada uji F standar, sedangkan GZLM didasarkan pada Wald Chi-Square, benar? Saya telah membaca bahwa Wald Chi-Square digunakan ketika Anda menggunakan parameter sampel (seperti dalam GZLM).
Behacad
Berdasarkan jawaban ini, saya menambahkan pertanyaan ke posting asli!
Behacad
Oke, saya telah menambahkan para koresponden ke jawaban saya sebagai tanggapan.
onestop
5

Saya ingin memasukkan pengalaman saya dalam diskusi ini. Saya telah melihat bahwa model linear umum (menentukan fungsi tautan identitas dan distribusi keluarga normal) identik dengan model linier umum hanya ketika Anda menggunakan perkiraan kemungkinan maksimum sebagai metode parameter skala. Kalau tidak, jika "nilai tetap = 1" dipilih sebagai metode parameter skala, Anda akan mendapatkan nilai p yang sangat berbeda. Pengalaman saya menyarankan bahwa biasanya "nilai tetap = 1" harus dihindari. Saya ingin tahu apakah ada yang tahu kapan saat yang tepat untuk memilih nilai tetap = 1 sebagai metode parameter skala. Terima kasih sebelumnya. Menandai


sumber
3
Biasanya orang menggunakan skala tetap hanya dengan model seperti regresi logistik atau regresi Poisson, di mana responsnya adalah variabel jumlah atau indikator / frekuensi. Dalam hal ini tidak ada analog dengan parameter skala dalam regresi normal.
Hong Ooi