Statistik dan Big Data

47
Tutorial statistik Bayesian

Saya mencoba meningkatkan kecepatan di Bayesian Statistics. Saya memiliki sedikit latar belakang statistik (STAT 101) tetapi tidak terlalu banyak - saya pikir saya bisa mengerti sebelumnya, posterior, dan kemungkinan: D. Saya tidak ingin membaca buku teks Bayesian dulu. Saya lebih suka membaca...

47
Bagaimana cara melakukan pemilihan subset regresi logistik?

Saya cocok dengan keluarga binomial glm di R, dan saya memiliki seluruh kelompok variabel penjelas, dan saya perlu menemukan yang terbaik (R-kuadrat sebagai ukuran baik-baik saja). Singkat penulisan skrip untuk mengulang melalui kombinasi acak yang berbeda dari variabel penjelas dan kemudian...

47
Klarifikasi tentang penafsiran interval kepercayaan?

Pemahaman saya saat ini tentang gagasan "interval kepercayaan dengan tingkat kepercayaan " adalah bahwa jika kita mencoba menghitung interval kepercayaan berkali-kali (setiap kali dengan sampel baru), itu akan berisi parameter dari waktu.1 - α1 - α1−α1 - \alpha1 - α1−α1 - \alpha Meskipun saya...

47
Istilah statistik yang paling membingungkan

Kami ahli statistik menggunakan banyak kata dengan cara yang sedikit berbeda dari cara orang lain menggunakannya. Ini menyebabkan banyak masalah ketika kita mengajar atau menjelaskan apa yang sedang kita lakukan. Saya akan memulai daftar (dan sekarang saya akan menambahkan beberapa definisi, per...

47
Memahami Naif Bayes

Dari StatSoft, Inc. (2013), Electronic Statistics Textbook , "Naive Bayes Classifier" : Untuk menunjukkan konsep Klasifikasi Naïve Bayes, perhatikan contoh yang ditampilkan dalam ilustrasi di atas. Seperti yang ditunjukkan, objek dapat diklasifikasikan sebagai GREEN atau RED. Tugas saya...

47
Mengapa harapan sama dengan rata-rata aritmatika?

Hari ini saya menemukan topik baru yang disebut Ekspektasi Matematika. Buku yang saya ikuti mengatakan, harapan adalah rata-rata aritmatika dari variabel acak yang berasal dari setiap distribusi probabilitas. Tetapi, ia mendefinisikan ekspektasi sebagai jumlah produk dari beberapa data dan...