Statistik dan Big Data

21
Menunjukkan bahwa 100 pengukuran untuk 5 subjek memberikan informasi yang jauh lebih sedikit daripada 5 pengukuran untuk 100 subjek

Di sebuah konferensi saya mendengar pernyataan berikut: 100 pengukuran untuk 5 subjek memberikan informasi yang jauh lebih sedikit daripada 5 pengukuran untuk 100 subjek. Ini agak jelas bahwa ini benar, tetapi saya bertanya-tanya bagaimana orang dapat membuktikannya secara matematis ... Saya...

21
Mengapa nama "kernel" dalam statistik dan ML?

Ini telah ditanyakan pada situs SE lainnya dalam konteks sistem operasi dan aljabar linier, tetapi pertanyaan yang sama mengganggu saya mengenai metode kernel yang digunakan dalam statistik dan pembelajaran mesin. Seringkali dikatakan bahwa kernel, misalnya dalam estimasi kepadatan kernel atau...

21
Apa sebenarnya benih dalam generator angka acak?

Saya mencoba beberapa pencarian google biasa dll tetapi sebagian besar jawaban yang saya temukan agak ambigu atau bahasa / perpustakaan tertentu seperti Python atau C ++ stdlib.hdll. Saya mencari bahasa agnostik, jawaban matematis, bukan spesifik perpustakaan. Sebagai contoh, banyak yang...

20
Apa nilai yang benar untuk presisi dan mengingat dalam kasus tepi?

Presisi didefinisikan sebagai: p = true positives / (true positives + false positives) Apakah benar bahwa, sebagai true positivesdan false positivespendekatan 0, presisi mendekati 1? Pertanyaan yang sama untuk diingat: r = true positives / (true positives + false negatives) Saat ini saya...

20
Apakah cuaca saya akurat?

Sebuah pertanyaan yang mengganggu saya selama beberapa waktu, yang saya tidak tahu bagaimana mengatasinya: Setiap hari, petugas cuaca saya memberikan persentase kemungkinan hujan (mari kita anggap itu dihitung hingga 9000 digit dan dia tidak pernah mengulangi angka). Setiap hari berikutnya, hujan...

20
Menerapkan "trik kernel" ke metode linear?

The Trik kernel yang digunakan dalam beberapa model pembelajaran mesin (misalnya SVM ). Ini pertama kali diperkenalkan dalam makalah "Fondasi teoretis dari metode fungsi potensial dalam pembelajaran pengenalan pola" pada tahun 1964. Definisi wikipedia mengatakan itu metode untuk menggunakan...

20
Algoritma Metropolis-Hastings digunakan dalam praktik

Saya membaca Blog Christian Robert hari ini dan cukup menyukai algoritma Metropolis-Hastings yang baru ia diskusikan. Tampaknya sederhana dan mudah diimplementasikan. Setiap kali saya membuat kode MCMC, saya cenderung tetap dengan algoritma MH yang sangat dasar, seperti gerakan independen atau...