Statistik dan Big Data

28
Apa alternatif untuk kapak yang patah?

Pengguna sering tergoda untuk memecah nilai sumbu untuk menyajikan data berbagai urutan besarnya pada grafik yang sama (lihat di sini ). Meskipun ini mungkin nyaman, itu tidak selalu merupakan cara yang disukai untuk menampilkan data (bisa menyesatkan di terbaik). Apa cara alternatif untuk...

28
Bagaimana cara mengurangi dimensi dalam R

Saya memiliki matriks di mana a (i, j) memberi tahu saya berapa kali individu yang saya lihat halaman j. Ada 27K individu dan 95K halaman. Saya ingin memiliki beberapa "dimensi" atau "aspek" dalam ruang halaman yang sesuai dengan set halaman yang sering dilihat bersama. Tujuan utama saya adalah...

28
Mulai seRious tentang deret waktu dengan R

Jika Anda berpikir kembali, ke saat Anda pertama kali memulai dengan analisis deret waktu. Alat apa, paket R, dan sumber daya internet yang Anda ingin ketahui? Yang ingin saya tanyakan adalah, di mana kita harus mulai? Secara khusus, apakah ada sumber daya untuk R yang benar-benar mendidih untuk...

28
Apa yang ada di balik Google Prediction API?

Google Prediction API adalah layanan cloud di mana pengguna dapat mengirimkan beberapa data pelatihan untuk melatih beberapa classifier misterius dan kemudian memintanya untuk mengklasifikasikan data yang masuk, misalnya untuk mengimplementasikan filter spam atau memprediksi preferensi...

28
Adaptasi jarak Kullback-Leibler?

Lihatlah foto ini: Jika kita mengambil sampel dari kepadatan merah maka beberapa nilai diharapkan kurang dari 0,25 sedangkan tidak mungkin untuk menghasilkan sampel seperti itu dari distribusi biru. Akibatnya, jarak Kullback-Leibler dari kepadatan merah ke densitas biru adalah tak terbatas....

28
Masalah dengan diagram lingkaran

Tampaknya ada peningkatan diskusi tentang diagram lingkaran. Argumen utama yang menentangnya adalah: Area dipersepsikan dengan kekuatan lebih kecil dari panjang. Pie chart memiliki rasio data-point-to-pixel yang sangat rendah Namun, saya pikir mereka bisa berguna ketika menggambarkan...

28
Menghitung pengulangan efek dari model lmer

Saya baru saja menemukan makalah ini , yang menjelaskan bagaimana menghitung pengulangan (alias reliabilitas, alias korelasi intraclass) dari pengukuran melalui pemodelan efek campuran. Kode R adalah: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...