Saya memiliki model linier umum berikut. Objek glmDV
dimodelkan sebagai proporsi keberhasilan atas uji coba total. Objek x_i
adalah variabel kontinu.
Seperti apakah ini dalam notasi matematika?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
r
generalized-linear-model
logit
notation
pengguna2205916
sumber
sumber
0
s &1
s (yang saya kumpulkan adalah apa yang Anda miliki berdasarkan deskripsi Anda), Anda harus menggunakanweights
argumen w / ? Glm , di mana bobot adalah jumlah total percobaan untuk setiap pengamatan.Jawaban:
Untuk regresi logistik biner, kasus penggunaan biasa untuk GLM binomial dengan tautan logit, Anda memodelkan probabilitas bahwa variabel dependen Anda adalah "sukses" (atau "ya"), yang secara konvensional diberi kode . Cara Anda melakukan ini adalah dengan memodelkan peluang log. Jadi, daripada memodelkan rata-rata respons seperti pada OLS, Anda memodelkan perubahan dalam peluang log:1
Di mana dan .logit(x)=log(x1−x) logit−1(x)=exp(x)1+exp(x)
Penjelasan yang lebih menyeluruh, sangat mudah ditemui tentang hal ini dapat ditemukan di Agresti, Pengantar Analisis Data Kategorikal.
Tetapi untuk pertanyaan khusus Anda, Anda menyatakan bahwa Anda memodelkan proporsi keberhasilan. Ini sebenarnya bukan apa yang dilakukan oleh GLM binomial. Namun, apa yang Anda benar - benar kejar adalah apa yang dilakukan oleh GLM binomial, dan masih mungkin di R. Hanya membutuhkan sedikit penyesuaian terhadap apa yang Anda lakukan. Dalam kasus di mana Anda memiliki jumlah percobaan hingga yang mungkin memiliki keberhasilan , Anda masih dapat menggunakan model yang sama, yang memiliki kepadatan Karena nilai Anda ditetapkan oleh desain eksperimental, dan adalah keberhasilan yang Anda amati, Anda melakukan inferensi pada parametern y∈{0...n}
Dalam hal R, cukup buat objek (yang Anda istilahkany n−y
glmDV
) yang merupakan matriks 2-kolom, kolom pertama jumlah keberhasilan dan yang kedua jumlah total kegagalan . Sisa pernyataan itu tetap sama!sumber
glm
dan, setahu saya, ia hanya menerima variabel respons 1 kolom, bukan dua kolom. Tolong koreksi saya jika saya salah dan sebutkan dokumentasi yang relevan jika memungkinkan. Terima kasih!glm
dokumentasi. Cara yang baik untuk mempelajari tentang cara kerja fungsi R adalah untuk Google nama fungsi; ini biasanya muncul dokumentasi yang relevan. Anda juga dapat mengetik?glm
ke konsol R