Statistik dan Big Data

9
Membuat data "demo" dari data nyata: menyamarkan tanpa menodai

(Saya tidak tahu apa yang harus ditandai dengan ini karena saya bukan ahli statistik dan saya tidak tahu bidang apa ini. Jangan ragu untuk menambahkan tag yang lebih cocok.) Saya bekerja untuk perusahaan yang memproduksi perangkat lunak analisis data, dan kami membutuhkan set data yang layak untuk...

9
Regresi melalui asal

Kami memiliki poin-poin berikut: Bagaimana kita dapat menemukan garis pemasangan terbaik melalui titik-titik? Kalkulator saya memiliki opsi untuk menemukan jalur pemasangan terbaik melalui titik-titik ini, yaitu:( 0 , 0 ) ( 1 , 51.8 ) ( 1.9 , 101.3 ) ( 2.8 , 148.4 ) ( 3.7 , 201.5 ) ( 4.7 , 251.1...

9
Formula Doane untuk binning histogram

Saya menerapkan berbagai algoritme untuk memperkirakan jumlah sampah terbaik yang digunakan untuk histogram. Sebagian besar yang saya laksanakan dijelaskan pada halaman "Histogram" Wikipedia di bagian " Jumlah sampah dan lebar " *. Saya terjebak pada masalah dengan rumus Doane: 1 + log(n) + log(1...

9
Pisau cukur Occam sudah usang?

Saya melihat buku-buku Vapnik tentang pembelajaran statistik ... Saya membaca beberapa bab pertama. Ngomong-ngomong, yang paling mengejutkanku adalah dia berpikir pisau cukur Occam sudah usang. Saya pikir itu terkait dengan situasi di mana dengan asumsi dimensi yang lebih tinggi meningkatkan...

9
Tipe III jumlah kuadrat

Saya memiliki model regresi linear dengan satu variabel kategoris (laki-laki & perempuan) dan satu variabel kontinu .BSEBUAHSEBUAHABBB Saya mengatur kode kontras dalam R dengan options(contrasts=c("contr.sum","contr.poly")). Dan sekarang saya memiliki tipe III jumlah kuadrat untuk , , dan...