Saya membaca A. Agresti (2007), Pengantar Analisis Data Kategorikal , 2. edisi, dan saya tidak yakin apakah saya memahami paragraf ini (hal.106, 4.2.1) dengan benar (walaupun seharusnya mudah):
Dalam Tabel 3.1 tentang mendengkur dan penyakit jantung pada bab sebelumnya, 254 subjek melaporkan mendengkur setiap malam, di antaranya 30 menderita penyakit jantung. Jika file data telah mengelompokkan data biner, satu baris dalam file data melaporkan data ini sebagai 30 kasus penyakit jantung dari ukuran sampel 254. Jika file data memiliki data biner yang tidak dikelompokkan, setiap baris dalam file data merujuk ke Pisahkan subjek, sehingga 30 baris mengandung 1 untuk penyakit jantung dan 224 baris berisi 0 untuk penyakit jantung. Estimasi ML dan nilai SE adalah sama untuk kedua jenis file data.
Mengubah satu set data yang tidak dikelompokkan (1 dependen, 1 independen) akan membutuhkan lebih dari "satu baris" untuk memasukkan semua informasi !?
Dalam contoh berikut, kumpulan data sederhana (tidak realistis!) Dibuat dan model regresi logistik dibuat.
Bagaimana sebenarnya data yang dikelompokkan akan terlihat (tab variabel?)? Bagaimana model yang sama dapat dibangun menggunakan data yang dikelompokkan?
> dat = data.frame(y=c(0,1,0,1,0), x=c(1,1,0,0,0))
> dat
y x
1 0 1
2 1 1
3 0 0
4 1 0
5 0 0
> tab=table(dat)
> tab
x
y 0 1
0 2 1
1 1 1
> mod1=glm(y~x, data=dat, family=binomial())
sumber
tab <- table(x,y, dnn=c('snoring','disease')); glm(tab ~ as.numeric(rownames(tab)), family=binomial)
akan berfungsi (tanda minus pembalikan untuk koefisien karena "Ya" diberi kode 0, bukan 1).