Statistik dan Big Data

15
Apa perbedaan antara PCA biasa dan PCA probabilistik?

Saya tahu PCA biasa tidak mengikuti model probabilistik untuk data yang diamati. Jadi apa perbedaan mendasar antara PCA dan PPCA ? Dalam PPCA, variabel model laten berisi misalnya variabel yang diamati , laten (variabel tidak teramati x ) dan matriks W yang tidak harus ortonormal seperti pada PCA...

15
Mengapa kita harus mengocok data saat melatih jaringan saraf?

Dalam pelatihan mini-batch jaringan saraf, saya mendengar bahwa praktik penting adalah mengocok data pelatihan sebelum setiap zaman. Adakah yang bisa menjelaskan mengapa pengocokan pada setiap zaman membantu? Dari pencarian google, saya menemukan jawaban berikut: ini membantu pelatihan bertemu...

15
Bagaimana menafsirkan entropi diferensial?

Saya baru-baru ini membaca artikel ini pada entropi distribusi probabilitas diskrit. Ini menjelaskan cara berpikir yang baik tentang entropi sebagai bit angka yang diharapkan (setidaknya ketika menggunakan log2log2\log_2 dalam definisi entropi Anda) yang diperlukan untuk menyandikan pesan ketika...

15
Akurasi yang baik meskipun nilai kerugiannya tinggi

Selama pelatihan dari sebuah classifier biner jaringan saraf sederhana saya mendapatkan nilai kerugian yang tinggi, menggunakan cross-entropy. Meskipun demikian, nilai akurasi pada set validasi cukup baik. Apakah ada artinya? Tidak ada korelasi ketat antara kehilangan dan akurasi? Saya memiliki...

15
Distribusi nol, apa sebenarnya mereka?

Saya berjuang untuk memahami distribusi nol meningkat. Apakah mereka? Apa gunanya? Jika saya memiliki data dengan banyak nol, maka saya bisa memasukkan regresi logistik pertama menghitung probabilitas nol, dan kemudian saya bisa menghapus semua nol, dan kemudian cocok dengan regresi reguler...

15
Mengapa Anda perlu skala data di KNN

Bisakah seseorang tolong jelaskan kepada saya mengapa Anda perlu menormalkan data saat menggunakan K tetangga terdekat. Saya sudah mencoba mencari ini, tetapi saya masih belum bisa memahaminya. Saya menemukan tautan berikut: https://discuss.analyticsvidhya.com/t/why-it-is-n