Statistik dan Big Data

24
Menentukan berbagai kelompok data 1d dari basis data

Saya memiliki tabel transfer data antara node yang berbeda. Ini adalah basis data yang sangat besar (dengan hampir 40 juta transfer). Salah satu atribut adalah jumlah byte (nbytes) transfer yang berkisar dari 0 byte hingga 2 tera byte. Saya ingin mengelompokkan nbytes sehingga diberikan k cluster...

24
Berapa besar set pelatihan yang dibutuhkan?

Apakah ada metode umum yang digunakan untuk menentukan berapa banyak sampel pelatihan yang diperlukan untuk melatih classifier (LDA dalam kasus ini) untuk mendapatkan akurasi generalisasi ambang batas minimum? Saya bertanya karena saya ingin meminimalkan waktu kalibrasi yang biasanya diperlukan...

24
Modul Python untuk analisis titik perubahan

Saya mencari modul Python yang melakukan analisis titik-perubahan pada rangkaian waktu. Ada sejumlah algoritma yang berbeda dan saya ingin menjelajahi kemanjuran beberapa dari mereka tanpa harus memutar setiap algoritma. Idealnya saya ingin beberapa modul seperti bcp (Bayesian Change Point) atau...