Statistik dan Big Data

25
LSA vs PCA (pengelompokan dokumen)

Saya menyelidiki berbagai teknik yang digunakan dalam pengelompokan dokumen dan saya ingin menghapus beberapa keraguan tentang PCA (analisis komponen utama) dan LSA (analisis semantik laten). Hal pertama - apa perbedaan di antara mereka? Saya tahu bahwa di PCA, dekomposisi SVD diterapkan ke...

25
Menggambar dari distribusi Dirichlet

Katakanlah kita memiliki distribusi Dirichlet dengan parameter vektor -dimensional . Bagaimana saya bisa menggambar sampel ( vektor dimensi) dari distribusi ini? Saya membutuhkan (mungkin) penjelasan sederhana.KKKα⃗ = [α1,α2, . . . ,αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1,...

25
Intuisi di balik regresi logistik

Baru-baru ini saya mulai mempelajari pembelajaran mesin, namun saya gagal memahami intuisi di balik regresi logistik . Berikut ini adalah fakta tentang regresi logistik yang saya mengerti. Sebagai dasar untuk hipotesis kami menggunakan fungsi sigmoid . Saya mengerti mengapa hal itu merupakan...

25
Bagaimana cara menggunakan hasil R prcomp untuk prediksi?

Saya memiliki data.frame dengan 800 obs. dari 40 variabel, dan ingin menggunakan Analisis Komponen Prinsip untuk meningkatkan hasil prediksi saya (yang sejauh ini bekerja paling baik dengan Mesin Vector Support pada sekitar 15 variabel pilihan). Saya mengerti prcomp dapat membantu saya...