Statistik dan Big Data

8
Apakah data binning valid sebelum korelasi Pearson?

Apakah dapat diterima untuk menyimpan data, menghitung rata-rata sampah, dan kemudian mendapatkan koefisien korelasi Pearson berdasarkan rata-rata ini? Tampaknya prosedur yang agak mencurigakan bagi saya dalam hal itu (jika Anda menganggap data sebagai sampel populasi) sebaran rata-rata ini akan...

8
Naif Bayes pada variabel kontinu

Tolong izinkan saya untuk mengajukan pertanyaan dasar. Saya memahami mekanisme Naive Bayes untuk variabel diskrit, dan dapat mengulang perhitungan "dengan tangan". (kode HouseVotes84 semua jalan per di bawah ini). Namun - Saya berjuang untuk melihat bagaimana mekanisme bekerja untuk variabel...

8
Memilih prior yang tidak informatif

Saya sedang mengerjakan model yang mengandalkan fungsi parametrized jelek yang berfungsi sebagai fungsi kalibrasi pada bagian model. Menggunakan pengaturan Bayesian, saya perlu mendapatkan prior non-informatif untuk parameter yang menggambarkan fungsi saya. Saya tahu bahwa idealnya, saya harus...

8
Bagaimana cara menggabungkan beberapa dataset imputed?

Saya memerlukan satu set data imputed (misalnya untuk membuat dummy grup negara dari data pendapatan per kapita negara imputed). R menawarkan paket paket untuk membuat beberapa data imputasi (misalnya Amelia) dan menggabungkan hasil dari beberapa dataset (seperti dalam MItools). Kekhawatiran saya...