Statistik dan Big Data

17
R: hitung korelasi berdasarkan kelompok

Terkunci . Pertanyaan ini dan jawabannya dikunci karena pertanyaannya di luar topik tetapi memiliki signifikansi historis. Saat ini tidak menerima jawaban atau interaksi baru. Dalam R, saya memiliki kerangka data yang terdiri dari label kelas C (faktor) dan dua

17
Apa perbedaan antara statistik dan biostatistik?

Terpikir oleh saya bahwa, walaupun saya telah mengumpulkan beberapa ide selama bertahun-tahun tentang perbedaan antara statistik dan biostatistik, saya belum pernah mendengar penjelasan formal. Apa perbedaan antara kedua disiplin ini (saat ini)? Dan mengapa perbedaan ini dimulai sejak awal? EDIT:...

17
Analisis Bayesian nonparametrik dalam R

Saya mencari tutorial yang baik tentang pengelompokan data dalam Rmenggunakan proses hierarchical dirichlet (HDP) (salah satu metode Bayesian nonparametrik populer dan terbaru). Ada DPpackage(IMHO, yang paling komprehensif dari semua yang tersedia) Runtuk analisis Bayesian nonparametrik. Tetapi...

17
Mengapa menggunakan penskalaan Platt?

Untuk mengkalibrasi tingkat kepercayaan ke probabilitas dalam pembelajaran yang diawasi (katakanlah untuk memetakan kepercayaan dari SVM atau pohon keputusan menggunakan data yang terlalu banyak) salah satu metode adalah dengan menggunakan Penskalaan Platt (misalnya, Memperoleh Kemungkinan yang...

17
Ukuran kualitas pengelompokan

Saya memiliki algoritma clustering (bukan k-means) dengan input parameter (jumlah cluster). Setelah melakukan pengelompokan, saya ingin mendapatkan ukuran kuantitatif kualitas pengelompokan ini. Algoritma pengelompokan memiliki satu properti penting. Untuk k = 2 jika saya memberi makan titik data N...

17
Lansekap statistik

Adakah yang menulis survei singkat tentang berbagai pendekatan statistik? Untuk perkiraan pertama, Anda memiliki statistik sering dan Bayesian. Tetapi ketika Anda melihat lebih dekat, Anda juga memiliki pendekatan lain seperti likelihoodist dan empiris Bayes. Dan kemudian Anda memiliki subdivisi...

17
Regresi Logistik dan Struktur Data

Saya berharap bisa mengajukan pertanyaan ini dengan cara yang benar. Saya memiliki akses ke data play-by-play, jadi ini lebih merupakan masalah dengan pendekatan terbaik dan membangun data dengan benar. Yang ingin saya lakukan adalah menghitung probabilitas memenangkan game NHL mengingat skor dan...

17
Apakah median lebih adil dari rata-rata?

Baru-baru ini saya membaca saran bahwa Anda harus menggunakan median bukan berarti untuk menghilangkan outlier. Contoh: Artikel berikut ini http://www.amazon.com/Forensic-Science-Introduction-Scientific-Investigative/product-reviews/1420064932/ memiliki 16 ulasan saat ini: review= c(5, 5, 5, 5,...

17
Apakah "setiap orang berkemeja biru" adalah sampel sistematis?

Saya mengajar kelas statistik intro dan sedang meninjau jenis-jenis pengambilan sampel, termasuk pengambilan sampel sistematis di mana Anda mencicipi setiap individu atau objek. Seorang siswa bertanya apakah pengambilan sampel setiap orang dengan karakteristik tertentu akan mencapai hal yang...