Statistik dan Big Data

15
Menghitung AIC "dengan tangan" di R

Saya telah mencoba menghitung AIC dari regresi linier dalam R tetapi tanpa menggunakan AICfungsi, seperti ini: lm_mtcars <- lm(mpg ~ drat, mtcars) nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2) [1] 97.98786 Namun, AICmemberikan nilai...

15
Apa artinya menjelaskan perbedaan?

Secara khusus, saya bertanya-tanya mengapa kita memiliki konsep Multiple R (yang dapat saya pahami sebagai korelasi antara skor yang diamati dan yang diprediksi dalam regresi berganda), dan kemudian konsep terpisah R-squared yang hanya berbentuk bujur sangkar atau R. Saya telah diberi tahu bahwa...

15
SVM untuk data yang tidak seimbang

Saya ingin mencoba menggunakan Support Vector Machines (SVMs) pada dataset saya. Sebelum saya mencoba masalah, saya diperingatkan bahwa SVM tidak bekerja dengan baik pada data yang sangat tidak seimbang. Dalam kasus saya, saya dapat memiliki sebanyak 95-98% 0 dan 2-5% 1. Saya mencoba untuk...

15
Apa definisi akurasi Top-n?

Saya membaca makalah ilmiah tentang klasifikasi gambar. Dalam hasil percobaan mereka berbicara tentang akurasi top-1 dan top-5 tetapi saya belum pernah mendengar istilah itu, juga tidak dapat menemukannya menggunakan google. Bisakah seseorang memberi saya definisi atau menunjuk saya ke suatu...

15
Regresi punggungan - interpretasi Bayesian

Saya telah mendengar bahwa regresi ridge dapat diturunkan sebagai rata-rata distribusi posterior, jika prior dipilih secara memadai. Apakah intuisi bahwa kendala seperti yang ditetapkan pada koefisien regresi oleh sebelumnya (misalnya distribusi normal standar sekitar 0) adalah identik / ganti...

15
Bagaimana cara menghitung kemurnian?

Dalam analisis kluster bagaimana kita menghitung kemurnian? Apa persamaannya? Saya tidak mencari kode untuk melakukannya untuk saya. Biarkan menjadi cluster k, dan c_j menjadi kelas j.c jωkωk\omega_kcjcjc_j Jadi apakah kemurnian bisa dibilang akurat? sepertinya menjumlahkan jumlah kelas yang...

15
Arti fitur laten?

Saya mencoba memahami model faktorisasi matriks untuk sistem yang merekomendasikan dan saya selalu membaca 'fitur laten', tetapi apa artinya itu? Saya tahu apa artinya fitur untuk dataset pelatihan tapi saya tidak bisa memahami ide fitur laten. Setiap makalah tentang topik yang saya temukan terlalu...

15
Nilai P sama dengan 0 dalam uji permutasi

Saya memiliki dua set data dan saya ingin tahu apakah mereka berbeda secara signifikan atau tidak (ini berasal dari " Dua kelompok berbeda secara signifikan? Tes untuk digunakan "). Saya memutuskan untuk menggunakan tes permutasi, melakukan hal berikut di R: permutation.test <-...