Saya mencoba mengonversi kolom faktor menjadi variabel dummy:
str(cards$pointsBin)
# Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ...
labels <- model.matrix(~ pointsBin, data=cards)
head(labels)
# (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300
# 741 1 0 0 0 0
# 407 1 1 0 0 0
# 676 1 0 0 1 0
# 697 1 1 0 0 0
# 422 1 0 1 0 0
# 300 1 0 1 0 0
Tidak ada kolom untuk nilai pertama dari faktor saya ( ".lte100"
), yang harus dikategorikan sebagai baris pertama. Bagaimana saya mendapatkan kembali data ini? Dan apa arti kolom Intercept yang tampaknya menjadi 1 semua?
r
categorical-data
categorical-encoding
digitgopher
sumber
sumber
- 1
ketika Anda memiliki satu prediktor kategori yang direpresentasikan sebagai faktor (seperti dalam pertanyaan ini), ia akan menganggap Anda tidak benar-benar bermaksud itu & beralih untuk menggunakan jumlah- to-zero coding; yang tentu saja hanya parametrization yang berbeda. Terlalu ramah, jika Anda bertanya kepada saya.Jawaban:
Pertimbangkan yang berikut ini:
Dua perintah pertama identik. Dua perintah terakhir menentukan untuk tidak menghasilkan intersepsi dan membuat dua variabel tiruan diproduksi.
sumber