Statistik dan Big Data

11
Apakah bootstrap cocok untuk data kontinu ini?

Saya seorang pemula lengkap :) Saya sedang melakukan penelitian dengan ukuran sampel 10.000 dari populasi sekitar 745.000. Setiap sampel mewakili "persentase kesamaan". Sebagian besar sampel adalah sekitar 97% -98% tetapi beberapa berada di antara 60% dan 90%, yaitu, distribusi sangat condong...

11
Harapan Gamma kuadrat

Jika distribusi Gamma diparameterisasi dengan dan , maka:αα\alphaββ\beta E(Γ(α,β))=αβE(Γ(α,β))=αβ E(\Gamma(\alpha, \beta)) = \frac{\alpha}{\beta} Saya ingin menghitung ekspektasi Gamma kuadrat, yaitu: E(Γ(α,β)2)=?E(Γ(α,β)2)=? E(\Gamma(\alpha, \beta)^2) = ? Saya pikir itu...

11
Pemrograman Quadratic dan Lasso

Saya mencoba melakukan regresi laso, yang memiliki bentuk sebagai berikut: Minimalkan dalam( Y - X w ) ′ ( Y - X w ) + λwww( Y- Xw )′( Y- Xw ) + λ| w |1(Y−Xw)′(Y−Xw)+λ|w|1(Y - Xw)'(Y - Xw) + \lambda \;|w|_1 Diberikan , saya disarankan untuk mencari optimal dengan bantuan pemrograman kuadratik,...

11
Apa itu distribusi peluang log?

Saya membaca buku teks tentang pembelajaran mesin (Data Mining oleh Witten, et al., 2011) dan menemukan bagian ini: ... Selain itu, distribusi yang berbeda dapat digunakan. Meskipun distribusi normal biasanya merupakan pilihan yang baik untuk atribut numerik, itu tidak cocok untuk atribut yang...