Pertanyaan yang diberi tag linear-model

12
Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?

Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE),...

12
Dimungkinkan untuk mengevaluasi GLM dengan Python / scikit-belajar menggunakan distribusi Poisson, Gamma, atau Tweedie sebagai keluarga untuk distribusi kesalahan?

Mencoba mempelajari beberapa Python dan Sklearn, tetapi untuk pekerjaan saya, saya perlu menjalankan regresi yang menggunakan distribusi kesalahan dari keluarga Poisson, Gamma, dan terutama Tweedie. Saya tidak melihat apa pun dalam dokumentasi tentang mereka, tetapi mereka berada di beberapa...

11
Asumsi normalitas dalam regresi linier

Sebagai asumsi regresi linier, normalitas distribusi kesalahan kadang-kadang salah "diperluas" atau ditafsirkan sebagai kebutuhan untuk normalitas y atau x. Apakah mungkin untuk membuat skenario / dataset bahwa di mana X dan Y adalah tidak normal tetapi istilah kesalahannya adalah dan oleh karena...