Statistik dan Big Data

23
Perpustakaan C ++ untuk komputasi statistik

Saya punya algoritma MCMC tertentu yang ingin saya porting ke C / C ++. Sebagian besar perhitungan mahal dalam C sudah melalui Cython, tapi saya ingin agar seluruh sampler ditulis dalam bahasa yang dikompilasi sehingga saya bisa menulis pembungkus untuk Python / R / Matlab / apa pun. Setelah...

23
Situs untuk kompetisi pemodelan prediktif

Saya berpartisipasi dalam kompetisi pemodelan prediktif di Kaggle , TunedIt , dan CrowdAnalytix . Saya menemukan bahwa situs-situs ini adalah cara yang baik untuk "berolahraga" untuk statistik / pembelajaran mesin. Apakah ada situs lain yang harus saya ketahui? Bagaimana perasaan Anda semua...

23
Distribusi jarak pengamatan tingkat Mahalanobis

Jika saya memiliki sampel iid multivariat normal , dan tentukan (yang merupakan semacam jarak Mahalanobis [kuadrat] dari titik sampel ke vektor menggunakan matriks untuk menentukan bobot), berapakah distribusi (jarak Mahalanobis ke sampel mean menggunakan sampel kovarians matriks )?d 2 i ( b , A )...

23
Interpretasi nomor AIC & BIC

Saya mencari contoh bagaimana menafsirkan estimasi AIC (kriteria informasi Akaike) dan BIC (kriteria informasi Bayesian). Bisakah perbedaan negatif antara BIC ditafsirkan sebagai peluang posterior dari satu model di atas yang lain? Bagaimana saya bisa mengatakannya dengan kata-kata? Misalnya BIC...