Statistik dan Big Data

11
Apa Drosophila AI sekarang?

Pada pertengahan 1960-an, para peneliti dengan terkenal menyebut catur sebagai " Drosophila of AI": seperti halnya lalat buah, permainan catur dapat diakses dan masalah yang relatif mudah untuk diujicobakan, yang belum menghasilkan pengetahuan penting masalah yang lebih kompleks. Sekarang, orang...

11
Pemilihan fitur otomatis untuk deteksi anomali

Apa cara terbaik untuk memilih fitur secara otomatis untuk deteksi anomali? Saya biasanya memperlakukan Deteksi Anomali sebagai algoritme di mana fitur dipilih oleh para ahli manusia: yang penting adalah kisaran output (seperti pada "input abnormal - output abnormal") sehingga bahkan dengan banyak...

11
Tutorial PCA praktis dengan data

Pencarian di internet untuk tutorial PCA memberikan ribuan hasil (bahkan video). Banyak tutorial yang sangat bagus. Tetapi saya tidak dapat menemukan contoh praktis di mana PCA dijelaskan menggunakan beberapa set data yang dapat saya gunakan untuk demonstrasi. Saya membutuhkan tutorial yang...

11
Apa itu "Prioritas Informasi Unit"?

Saya telah membaca Wagenmakers (2007) Sebuah solusi praktis untuk masalah meresapi nilai p . Saya tertarik dengan konversi nilai BIC menjadi faktor dan probabilitas Bayes. Namun, sejauh ini saya tidak memiliki pemahaman yang baik tentang apa sebenarnya informasi unit sebelumnya . Saya akan...

11
Meningkatkan nama variabel dalam dataset

Nama variabel yang baik adalah: a) pendek / mudah diketik, b) mudah diingat, c) dimengerti / komunikatif. Apakah saya lupa sesuatu? Konsistensi adalah sesuatu yang harus dicari. Menurut saya, konvensi penamaan yang konsisten berkontribusi pada kualitas di atas. Konsistensi berkontribusi pada...

11
Pemilihan model ABC

Telah ditunjukkan bahwa pilihan model ABC menggunakan faktor Bayes tidak direkomendasikan karena adanya kesalahan yang berasal dari penggunaan statistik ringkasan. Kesimpulan dalam makalah ini bergantung pada studi tentang perilaku metode populer untuk mendekati faktor Bayes (Algoritma...