Statistik dan Big Data

10
Perbedaan antara Outlier dan Inlier

Saya menemukan istilah inlier dalam ukuran LOF (Local Outlier Factor), saya akrab dengan istilah outlier (pada dasarnya liers - contoh yang tidak berperilaku seperti contoh lainnya). Apa arti 'Inliers' dalam konteks deteksi anomali? dan bagaimana hal itu terkait dengan (berbeda dari)...

10
Jika

Untuk variabel acak berkesinambungan XXX , jika E(|X|)E(|X|)E(|X|) adalah terbatas, apakah limn→∞nP(|X|>n)=0limn→∞nP(|X|>n)=0\lim_{n\to\infty}n P(|X|>n)=0 ? Ini adalah masalah yang saya temukan di internet, tetapi saya tidak yakin apakah itu berfungsi atau tidak. Saya tahu bahwa...

10
Apa itu pemrograman probabilistik?

Selama setahun terakhir, saya telah banyak mendengar tentang kerangka kerja Programming Probabilistic (PP) seperti PyMC3 dan Stan , dan betapa hebatnya PP. Dan hari ini, seseorang membagikan tautan ini kepada saya: Pyro: Bahasa Pemrograman Probabilitas Jauh Namun, saya tidak benar-benar...

10
Bukti mudah

Biarkan menjadi variabel standar normal acak independen. Ada banyak bukti (panjang) di luar sana, yang menunjukkan hal ituZ1, ⋯ , ZnZ1,⋯,ZnZ_1,\cdots,Z_n ∑i=1n(Zi−1n∑j=1nZj)2∼χ2n−1∑saya=1n(Zsaya-1n∑j=1nZj)2∼χn-12 \sum_{i=1}^n \left(Z_i - \frac{1}{n}\sum_{j=1}^n Z_j \right)^2 \sim \chi^2_{n-1}...

10
Metode inisialisasi K-means clustering

Saya tertarik pada kondisi terkini untuk memilih benih awal (pusat cluster) untuk K-means. Googling mengarah ke dua pilihan populer: pemilihan awal benih secara acak, dan, menggunakan teknik pemilihan KMeans ++: Arthur & Vassilvitskii 2006 k-means ++: Keuntungan Pembibitan...