Statistik dan Big Data

42
Mengapa downsample?

Misalkan saya ingin mempelajari classifier yang memprediksi jika email adalah spam. Dan anggaplah hanya 1% dari email adalah spam. Hal termudah untuk dilakukan adalah mempelajari pengklasifikasi sepele yang mengatakan tidak ada email yang merupakan spam. Penggolong ini akan memberi kita akurasi...

42
Metode pengaturan untuk regresi logistik

Regularisasi menggunakan metode seperti Ridge, Lasso, ElasticNet cukup umum untuk regresi linier. Saya ingin tahu yang berikut: Apakah metode ini berlaku untuk regresi logistik? Jika demikian, apakah ada perbedaan dalam cara mereka perlu digunakan untuk regresi logistik? Jika metode ini tidak dapat...

41
Regresi: Mengubah Variabel

Saat mentransformasikan variabel, apakah Anda harus menggunakan semua transformasi yang sama? Misalnya, dapatkah saya memilih dan memilih variabel yang diubah secara berbeda, seperti pada: Biarkan, menjadi usia, lama bekerja, lama tinggal, dan penghasilan.x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y =...

41
Regresi Logistik dalam R (Odds Ratio)

Saya mencoba melakukan analisis regresi logistik di R. Saya telah mengikuti kursus yang membahas materi ini menggunakan STATA. Saya merasa sangat sulit untuk meniru fungsi di R. Apakah sudah matang di area ini? Tampaknya ada sedikit dokumentasi atau panduan yang tersedia. Memproduksi output odds...

41
OpenBugs vs. JAGS

Saya akan mencoba lingkungan gaya BUGS untuk memperkirakan model Bayesian. Apakah ada keuntungan penting untuk dipertimbangkan dalam memilih antara OpenBugs atau JAGS? Apakah salah satu akan menggantikan yang lain di masa mendatang? Saya akan menggunakan Gibbs Sampler yang dipilih dengan R. Saya...

41
Game bagus untuk belajar berpikir statistik?

Apakah ada game yang membuat pemain "berpikir seperti ahli statistik"? Misalnya, lightbot membuat Anda "berpikir seperti seorang programmer" (dengan cara yang sangat mendasar). Apakah ada permainan - yang dirancang untuk hiburan atau pengajaran - yang dapat membantu Anda merasa nyaman dengan...