R keluarga binomial dengan tautan identitas

8

Saya ingin mencocokkan model linier dengan R family=binomial(link="identity"), namun, keluarga binomial tidak memiliki tautan identitas. Apa yang harus saya lakukan?

David
sumber
Saya pikir ada masalah statistik mendasar di sini.
Glen_b -Reinstate Monica
ya, pertanyaan berikut akan bertanya tentang Sesuaikan kesalahan standar untuk penayangan berlebih.
david
Tetapi untuk yang pertama, saya perlu menggunakan tautan identitas dalam keluarga binomial, tetapi R tidak mengizinkannya.
david
1
Perhatikan bahwa jika Anda perlu menangani penyebaran berlebihan dan menggunakan tautan identitas, Anda harus mempertimbangkan untuk langsung menuju model semu dengan fungsi varians binomial. Model binomial intercept-only dapat dipasang dengan tangan .
Glen_b -Reinstate Monica
2
(Dan jika Anda ingin parameter dispersi tetap pada satu: family=binomial(link=make.link("identity")).
Scortchi - mengembalikan Monica

Jawaban:

9

Lihat Wikipedia pada model probabilitas linier , & posting CV di sini & di sini untuk latar belakang statistik. Meskipun bukan "salah", Anda pasti menginginkan alasan yang baik untuk menggunakan tautan identitas untuk memodelkan probabilitas Bernoulli.

Menurut familymanual

keluarga binomial [menerima] link logit, probit, cauchit, (sesuai dengan logistik, normal dan Cauchy CDF masing-masing) log dan cloglog(komplementer log-log)

Tapi

Argumen tautan dan varians memiliki semantik yang agak canggung untuk kompatibilitas-kembali. Cara yang disarankan adalah menyediakannya seperti string karakter yang dikutip, tetapi mereka juga dapat diberikan tanpa tanda kutip (sebagai nama atau ekspresi). Selain itu, mereka juga dapat diberikan sebagai vektor karakter panjang-satu memberikan nama salah satu opsi, atau sebagai daftar (untuk link, kelas "link-glm"). Batasan hanya berlaku untuk tautan yang diberikan sebagai nama: bila diberikan sebagai string karakter, semua tautan yang diketahui make.linkditerima.

Begitu family=binomial(link="identity")berhasil tetapi family=binomial(link=identity)tidak. (Jika Anda menemukan secara berbeda mungkin itu berkaitan dengan versi R.) Untuk memungkinkan dispersi berlebih, maka gunakan family=quasi(link="identity", variance = "mu(1-mu)").

Scortchi - Reinstate Monica
sumber
tautan = "identitas" vs. tautan = perbaikan identitas sangat membantu. Ini adalah latihan di buku teks CDA Agresti. Kode yang ia berikan adalah kuasi (tautan ...) yang Anda diskusikan, namun kesederhanaan menambahkan "" adalah perbaikan yang elegan. Untuk pemahaman saya, panggilan tautan = "identitas" mewakili binomial sebagai model linier.
Justin Peterson