Statistik dan Big Data

10
Bagaimana cara mengukur redundansi fitur?

Saya memiliki tiga fitur yang saya gunakan untuk menyelesaikan masalah klasifikasi. Awalnya, fitur-fitur ini menghasilkan nilai boolean, jadi saya bisa mengevaluasi redundansi mereka dengan melihat berapa banyak set klasifikasi positif dan negatif yang tumpang tindih. Sekarang saya telah memperluas...

10
Menggunakan paket statistik dalam R untuk kmeans clustering

Saya mengalami kesulitan memahami satu atau dua aspek dari paket cluster. Saya mengikuti contoh dari Quick-R dengan cermat, tetapi tidak memahami satu atau dua aspek analisis. Saya telah memasukkan kode yang saya gunakan untuk contoh khusus ini. ## Libraries library(stats) library(fpc) ##...

10
Menguji perangkat lunak statistik

Teknik / pendekatan apa yang berguna dalam menguji perangkat lunak statistik? Saya sangat tertarik pada program yang melakukan estimasi parametrik menggunakan kemungkinan maksimum. Membandingkan hasil dengan yang dari program lain atau sumber yang diterbitkan tidak selalu mungkin karena sebagian...

10
Analisis meta dalam R menggunakan paket metafor

Bagaimana seharusnya saya menyinkronkanrma fungsi dari paket metafor untuk mendapatkan hasil dalam contoh kehidupan nyata berikut dari meta-analisis kecil? (efek acak, ringkasan statistik SMD) study, mean1, sd1, n1, mean2, sd2, n2 Foo2000, 0.78, 0.05, 20, 0.82, 0.07, 25 Sun2003, 0.74, 0.08, 30,...

10
Plot regresi kompleks dalam R

Saya perlu menggambar grafik yang kompleks untuk analisis data visual. Saya memiliki 2 variabel dan sejumlah besar kasus (> 1000). Misalnya (angka 100 jika membuat dispersi kurang "normal"): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <- data.frame(x=x,y=y) 1) Saya...

10
Masalah perangkap variabel dummy

Saya menjalankan regresi OLS besar di mana semua variabel independen (sekitar 400) adalah variabel dummy. Jika semua termasuk, ada multikolinieritas sempurna (perangkap variabel dummy), jadi saya harus menghilangkan salah satu variabel sebelum menjalankan regresi. Pertanyaan pertama saya adalah,...