Statistik dan Big Data

15
Contoh proses yang bukan Poisson?

Saya mencari beberapa contoh bagus situasi yang tidak cocok untuk model dengan distribusi Poisson, untuk membantu saya menjelaskan distribusi Poisson kepada siswa. Orang biasanya menggunakan jumlah pelanggan yang tiba di toko dalam interval waktu sebagai contoh yang dapat dimodelkan oleh...

15
Memvisualisasikan hasil model campuran

Salah satu masalah yang selalu saya alami dengan model campuran adalah mencari tahu visualisasi data - dari jenis yang bisa berakhir di kertas atau poster - setelah seseorang mendapatkan hasilnya. Saat ini, saya sedang mengerjakan model efek campuran Poisson dengan formula yang terlihat seperti...

15
Hutan acak terlalu cocok

Saya mencoba menggunakan Regresi Hutan Acak di scikits-learn. Masalahnya adalah saya mendapatkan kesalahan tes yang sangat tinggi: train MSE, 4.64, test MSE: 252.25. Beginilah tampilan data saya: (biru: data nyata, hijau: diperkirakan): Saya menggunakan 90% untuk pelatihan dan 10% untuk ujian....

15
Mengapa kita menstabilkan varians?

Saya menemukan transformasi penstabil varian ketika membaca metode Kaggle Essay Eval . Mereka menggunakan transformasi stabilisasi varian untuk mengubah nilai-nilai kappa sebelum mengambil rata-rata mereka dan kemudian mengubahnya kembali. Bahkan setelah membaca wiki pada transformasi penstabilan...

15
Arti istilah output dalam paket gbm?

Saya menggunakan paket gbm untuk klasifikasi. Seperti yang diharapkan, hasilnya bagus. Tetapi saya mencoba memahami output dari classifier. Ada lima istilah dalam output. `Iter TrainDeviance ValidDeviance StepSize Improve` Adakah yang bisa menjelaskan arti setiap istilah, terutama arti...

15
Perbandingan daftar peringkat

Misalkan dua kelompok, terdiri dari dan masing-masing peringkat satu set 25 item dari yang paling penting sampai yang paling tidak penting. Apa cara terbaik untuk membandingkan peringkat ini?n1n1n_1n2n2n_2 Jelas, dimungkinkan untuk melakukan 25 tes Mann-Whitney U, tetapi ini akan menghasilkan 25...