Bagaimana cara menginterpretasikan istilah intersep dalam GLM?

20

Saya menggunakan R dan saya telah menganalisis data saya dengan GLM dengan tautan Binomial.

Saya ingin tahu apa arti intersep di tabel output. Penyadapan untuk salah satu model saya sangat berbeda, tetapi variabelnya tidak. Apa artinya ini?

Apa yang mencegat. Saya tidak tahu apakah saya hanya membingungkan diri sendiri tetapi setelah mencari di internet, tidak ada yang mengatakan, ini dia, perhatikan itu ... atau tidak.

Tolong bantu, siswa yang sangat frustrasi


glm(formula = attacked_excluding_app ~ treatment, family = binomial, 
    data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3548   0.3593   0.3593   0.3593   0.3593  
Coefficients:
                         Estimate Std. Error z value Pr(>|z|)   
(Intercept)                 2.708      1.033   2.622  0.00874 **
treatmentshiny_non-shiny    0.000      1.461   0.000  1.00000

(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963  on 31  degrees of freedom
Residual deviance: 14.963  on 30  degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5
Samuel Waldron
sumber
1
Apa fungsi tautan yang Anda tentukan di glm?
Tomas
5
Intersep adalah nilai prediksi dari variabel dependen ketika semua variabel independen adalah 0. Tanpa informasi lebih lanjut tentang model Anda, saya tidak bisa mengatakan apakah ini bermakna dalam kasus Anda.
Peter Flom - Pasang kembali Monica

Jawaban:

21

Istilah intersep adalah intersep pada bagian linear dari persamaan GLM, jadi model Anda untuk mean adalah , di mana g adalah fungsi tautan Anda dan X β adalah model linier Anda. Model linier ini berisi "istilah intersep", yaitu:E[Y]=g1(Xβ)gXβ

Xβ=c+X1β1+X2β2+

Dalam kasus Anda intersep secara signifikan bukan nol, tetapi variabelnya tidak, jadi dikatakan demikian

Xβ=c0

Karena fungsi tautan Anda adalah binomial, maka

g(μ)=ln(μ1μ)

Dan hanya dengan istilah intersep, model pas Anda untuk mean adalah:

E[Y]=11+ec

c=0E[Y]=11+1=0.5

Jadi hasil Anda mengatakan bahwa Anda tidak dapat memprediksi hasilnya, tetapi satu kelas (1 atau 0) lebih mungkin daripada yang lain.

Corone
sumber
2
Anda membuatku takut pada E [Y] = .... :). Terima kasih atas jawabannya, saya (mengerti) mengerti apa yang Anda katakan. Anda mengatakan bahwa intersepnya adalah sig. bukan nol, tetapi var. bukan, itu p = 1,00 !? Apa pengaruh variabel p-value terhadap apa yang dapat saya katakan tentang resut?
Samuel Waldron
2
Jika p-value variabel tidak kecil, yang biasanya tidak akan memasukkan variabel itu dalam model. Dalam kasus Anda, variabel tersebut bahkan tidak diperkirakan memiliki nilai bukan nol, maka nilai p sebesar 1,00. Pada dasarnya tidak ada hubungan antara "pengobatan" dan "attack_excluding_app". Tidak adanya hubungan sangat sempurna di sini sehingga hampir mencurigakan, meskipun Anda memiliki dataset kecil. Mungkin perlu memvisualisasikan data Anda, dan melihat apakah itu masuk akal.
Corone
2
+1 untuk jawaban, (dan saran dalam komentar bahwa sesuatu yang aneh sedang terjadi dalam dataset) walaupun saya tidak setuju dengan pembukaan komentar Anda "Jika variabel p-value tidak kecil, yang biasanya tidak akan memasukkan variabel itu dalam model." Ini belum tentu begitu - sering seseorang ingin melaporkan besarnya suatu hubungan, bahkan jika itu tidak "signifikan" (dan lebih tepatnya, jika Anda tertarik untuk memodelkan hubungan untuk memulai, maka hasil nol adalah masih penting untuk dilaporkan.)
James Stanley
1
@ James - poin yang sangat bagus, kita harus selalu melaporkan variabel apa yang Anda uji - Saya seharusnya lebih jelas, saya hanya bermaksud bahwa seseorang biasanya tidak akan memasukkan variabel itu ketika mencoba menggunakan model untuk membuat perkiraan (karena biasanya itu berarti overfitting ).
Corone
@Corone - Saya khususnya tertarik dengan komentar Anda di sini tentang variabel dalam / pengecualian dan hubungannya dengan utas di stats.stackexchange.com/questions/17624/…
rolando2
5

Sepertinya saya mungkin ada beberapa masalah dengan data. Aneh bahwa estimasi parameter untuk koefisien adalah 0,000. Sepertinya DV dan IV Anda dikotomis dan proporsi DV Anda tidak berbeda sama sekali dengan IV Anda. Apakah ini benar?

Intersep, seperti yang saya catat dalam komentar saya (dan seperti yang disiratkan oleh @corone) adalah nilai DV ketika IV adalah 0. Bagaimana kode IV Anda? Namun demikian, kenyataan bahwa estimasi untuk koefisien adalah 0,000 menyiratkan bahwa IV tidak membuat perbedaan.

log(p1p)

Peter Flom - Pasang kembali Monica
sumber
Hai teman-teman, sekali lagi terima kasih atas komentarnya. Titik data hampir identik. Saya melaporkannya dalam laporan dan tetap harus menyorotnya. Inilah mengapa hasilnya terlihat aneh. Dengan data ini (GLM) dan set data lainnya dalam laporan saya (GLMM) saya menjalankan deffinately (# TEAM2x2x2x2) sebelum saya bisa berjalan. Saya pikir masalah utama saya adalah mengetahui apa yang perlu saya laporkan, apakah saya mencatat statistik untuk intersep atau untuk IV? Di bawah ini saya (semoga lebih standar) GLMM lagi dengan tautan binomial.
Samuel Waldron
Model campuran linier umum yang sesuai dengan perkiraan Laplace: Diserang ~ Perawatan + Percobaan + Pengobatan * Percobaan + (1 | Burung) Data: data AIC BIC logLik penyimpangan 139.6 153.8 -64.78 129.6 Efek acak: Grup Nama Varians Std.Dev. Bird (Intercept) 0.87795 0.93699 Jumlah obs: 128, grup: Bird, 32
Samuel Waldron
Memperbaiki efek: Perkirakan Std. Kesalahan nilai z Pr (> | z |) (Intercept) 3.19504 0.90446 3.533 .000412 *** Perlakuanhiny_non-shiny 0,02617 1.26964 0.021 .983558 Percobaan -1.53880 0.36705 -4.192 2.76e-05 *** Pengobatan: Percobaan 0.16909 0.49501 0.342 .7325 --- Signif. kode: 0 ' ' 0,001 ' ' 0,01 ' ' 0,05 '.' 0,1 '' 1 Korelasi Efek Tetap: (Intr) Trtm_- Trial Trtmntshn_- -0,712 Trial -0,895 0,638 Trtmnts _-: T 0,664 -0,896 -0,742
Samuel Waldron
3

Dalam kasus Anda, intersep adalah mean rata-rata attacked_excluding_app, dihitung untuk semua data terlepas dari treatment. Uji signifikansi dalam tabel koefisien menguji apakah perbedaannya signifikan dari nol. Apakah ini relevan tergantung pada apakah Anda memiliki alasan a priori untuk mengharapkannya nol atau tidak.

Misalnya, bayangkan Anda telah menguji obat dan plasebo untuk pengaruhnya terhadap tekanan darah. Untuk setiap subjek, Anda mencatat perubahan tekanan darah mereka dengan menghitung (tekanan setelah perawatan - tekanan sebelum perawatan) dan memperlakukan ini sebagai variabel dependen dalam analisis Anda. Anda kemudian menemukan bahwa efek pengobatan (obat vs plasebo) tidak signifikan tetapi intersepnya secara signifikan> 0 - ini akan memberi tahu Anda bahwa rata-rata, tekanan darah subjek Anda meningkat antara dua kali pengukuran. Ini mungkin menarik dan perlu diselidiki lebih lanjut.

Freya Harrison
sumber