Statistik dan Big Data

9
Residu dalam regresi poisson

Zuur 2013 Beginners Guide to GLM & GLMM menyarankan validasi regresi Poisson dengan memplot residu Pearsons terhadap nilai yang dipasang. Zuur menyatakan kita seharusnya tidak melihat residu mengembang saat nilai pas meningkat, seperti plot yang dilampirkan (digambar tangan). Tapi saya pikir...

9
Bagaimana memasukkan

Saya ingin memasukkan istilah xxx dan kuadrat x2x2x^2 (variabel prediktor) ke dalam regresi karena saya berasumsi bahwa nilai rendah xxx memiliki efek positif pada variabel dependen dan nilai-nilai tinggi memiliki efek negatif. The x2x2x^2 harus menangkap efek dari nilai-nilai yang lebih tinggi....

9
Kekuasaan dalam proteomik?

Hibah sering memerlukan analisis daya untuk mendukung ukuran sampel yang diusulkan. Dalam proteomik (dan sebagian besar -omik), ada 100 hingga 1000 fitur / variabel yang diukur pada 10 sampel (mungkin 100-an, tetapi tidak mungkin). Juga, diketahui bahwa beberapa unit pengukuran ini (misalnya,...

9
tes anova tipe III untuk GLMM

Saya memasang glmermodel dalam lme4paket R. Saya mencari tabel anova dengan nilai p yang ditunjukkan di sini, tetapi saya tidak dapat menemukan paket yang cocok. Apakah mungkin melakukannya di R? Model yang saya pas adalah dalam bentuk: model1<-glmer(dmn~period*teethTreated+(1|fullName),...

9
Berlebihan dengan variabel kategori

Saya ingin melakukan kombinasi oversampling dan undersampling untuk menyeimbangkan dataset saya dengan sekitar 4000 pelanggan dibagi menjadi dua kelompok, di mana salah satu grup memiliki proporsi sekitar 15%. Saya telah melihat SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) dan...

9
Kapan sebaiknya menggunakan rata-rata untuk imputasi?

Misalkan kita memiliki tes kumpulan data : 1 8 12 14 . . 19 The . Menandakan hilang nilai-nilai. Kapan akan lebih baik menggunakan rata-rata dari nilai yang tidak hilang untuk menentukan nilai yang hilang daripada mengasumsikan bahwa data tersebut berasal dari distribusi