Statistik dan Big Data

47
Apakah splines overfitting data?

Masalah saya : Baru-baru ini saya bertemu dengan ahli statistik yang memberi tahu saya bahwa splines hanya berguna untuk mengeksplorasi data dan mengalami overfitting, sehingga tidak berguna dalam prediksi. Dia lebih suka menjelajahi dengan polinomial sederhana ... Karena saya penggemar berat...

46
Memahami regresi - peran model

Bagaimana model regresi dapat digunakan jika Anda tidak tahu fungsi yang Anda cari parameternya? Saya melihat sebuah penelitian yang mengatakan bahwa ibu yang menyusui anak-anak mereka cenderung menderita diabetes di kemudian hari. Penelitian ini berasal dari survei terhadap sekitar 1.000 ibu dan...

46
Bagaimana cara menghitung pseudo-

Tulisan Christopher Manning pada regresi logistik di R menunjukkan regresi logistik di R sebagai berikut: ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) Beberapa output: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family =...