Statistik dan Big Data

10
Nilai yang hilang dalam variabel respons dalam JAGS

Gelman & Hill (2006) mengatakan: Dalam Bug, hasil yang hilang dalam regresi dapat ditangani dengan mudah hanya dengan memasukkan vektor data, NA, dan semuanya. Bug secara eksplisit memodelkan variabel hasil, dan oleh karena itu sepele untuk menggunakan model ini untuk, dalam pengaruh,...

10
Penjelasan simulasi statistik

Saya bukan ahli statistik. Jadi, tolong tahan dengan kesalahan saya jika ada. Bisakah Anda jelaskan secara sederhana bagaimana simulasi dilakukan? Saya tahu bahwa itu mengambil beberapa sampel acak dari distribusi normal dan digunakan untuk simulasi. Tapi, jangan mengerti dengan

10
Interval kepercayaan untuk chi-square

Saya mencoba menemukan solusi untuk membandingkan dua tes "chi-square yang baik". Lebih tepatnya, saya ingin membandingkan hasil dari dua percobaan independen. Dalam percobaan ini penulis menggunakan good-of-fit chi-square untuk membandingkan tebakan acak (frekuensi yang diharapkan) dengan...

10
Bantuan dengan pemodelan SEM (OpenMx, polycor)

Saya punya banyak masalah dengan satu set data yang saya coba terapkan SEM. Kami menduga keberadaan 5 faktor laten A, B, C, D, E, dengan indikator resp. A1 to A5 (faktor yang dipesan), B1 ke B3 (kuantitatif), C1, D1, E1 (semua tiga faktor terakhir, dengan hanya 2 level untuk E1. Kami tertarik pada...

10
Di luar kernel Fisher

Untuk sementara, sepertinya Fisher Kernels mungkin menjadi populer, karena mereka tampaknya menjadi cara untuk membangun kernel dari model probabilistik. Namun, saya jarang melihat mereka digunakan dalam praktik, dan saya memiliki otoritas yang baik sehingga mereka cenderung tidak bekerja dengan...

10
Pembersihan data otomatis

Masalah umum adalah ML adalah kualitas data yang buruk: kesalahan dalam nilai fitur, contoh kesalahan klasifikasi, dll. Salah satu cara untuk mengatasi masalah ini adalah secara manual memeriksa data dan memeriksa, tetapi adakah teknik lain? (Aku yakin ada!) Mana yang lebih baik dan...