Prediksi saya yang berasal dari model regresi logistik (glm dalam R) tidak dibatasi antara 0 dan 1 seperti yang saya harapkan. Pemahaman saya tentang regresi logistik adalah bahwa parameter input dan model Anda digabungkan secara linear dan responsnya diubah menjadi probabilitas menggunakan fungsi tautan logit. Karena fungsi logit dibatasi antara 0 dan 1, saya perkirakan prediksi saya dibatasi antara 0 dan 1.
Namun bukan itu yang saya lihat ketika saya menerapkan regresi logistik di R:
data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub,
family = binomial(link = "logit"))
hist(predict(model))
Jika ada hasil prediksi (model) terlihat normal bagi saya. Adakah yang bisa menjelaskan kepada saya mengapa nilai yang saya dapatkan bukan probabilitas?
Jawaban:
The
predict.glm
Metode secara default mengembalikan prediktor pada skala prediktor linear. Yaitu mereka belum melalui fungsi tautan.Mencoba
hist(predict(model, type = "response"))
sebagai gantinya
sumber