Statistik dan Big Data

Pertanyaan dan jawaban untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

474
Apa perbedaan antara "kemungkinan" dan "probabilitas"?

The halaman wikipedia mengklaim bahwa kemungkinan dan probabilitas adalah konsep-konsep yang berbeda. Dalam bahasa non-teknis, "kemungkinan" biasanya merupakan sinonim untuk "probabilitas," tetapi dalam penggunaan statistik ada perbedaan yang jelas dalam perspektif: jumlah yang merupakan...

431
Apa perbedaan antara set tes dan set validasi?

Saya menemukan ini membingungkan ketika saya menggunakan toolbox jaringan saraf di Matlab. Ini membagi set data mentah menjadi tiga bagian: perlengkapan latihan set validasi set tes Saya perhatikan dalam banyak pelatihan atau algoritma pembelajaran, data sering dibagi menjadi 2 bagian, set...

420
Dua Budaya: statistik vs pembelajaran mesin?

Tahun lalu, saya membaca posting blog dari Brendan O'Connor yang berjudul "Statistics vs. Machine Learning, fight!" yang membahas beberapa perbedaan antara kedua bidang. Andrew Gelman menanggapi hal ini dengan baik : Simon Blomberg: Dari paket fortune R: Mengutip secara provokatif,...

355
Python sebagai meja kerja statistik

Banyak orang menggunakan alat utama seperti Excel atau spreadsheet lain, SPSS, Stata, atau R untuk kebutuhan statistik mereka. Mereka mungkin beralih ke beberapa paket khusus untuk kebutuhan yang sangat khusus, tetapi banyak hal dapat dilakukan dengan spreadsheet sederhana atau paket statistik umum...