Statistik dan Big Data

15
Mengapa distribusi 0 dan standar deviasi 1 selalu digunakan?

Statistik saya telah diajarkan sendiri, tetapi banyak materi yang saya baca menunjuk ke dataset yang memiliki mean 0 dan standar deviasi 1. Jika demikian, maka: Mengapa 0 dan SD 1 berarti properti yang baik untuk dimiliki? Mengapa variabel acak yang diambil dari sampel ini sama dengan 0,5?...

15
Grafik alternatif untuk plot plot “handle bar”

Dalam bidang penelitian saya, cara populer menampilkan data adalah dengan menggunakan kombinasi diagram batang dengan "bilah pegangan". Sebagai contoh, The "handle-bar" bergantian antara kesalahan standar dan standar deviasi tergantung pada penulis. Biasanya, ukuran sampel untuk setiap "bilah"...

15
Analisis korelasi silang antara titik-proses

Saya ingin saran tentang metode analisis yang saya gunakan, untuk mengetahui apakah itu baik secara statistik. Saya telah mengukur dua titik proses dan T 2 = t 2 1 , t 2 2 , . . . , t 2 m dan saya ingin menentukan apakah peristiwa di T 1 entah bagaimana berkorelasi dengan peristiwa di T 2 .T1=...

15
Survei alat perangkat lunak penambangan data

Meskipun saya dilatih sebagai seorang insinyur, saya menemukan bahwa saya menjadi lebih tertarik pada data mining. Saat ini saya sedang mencoba untuk menyelidiki bidang ini lebih lanjut. Secara khusus, saya ingin memahami berbagai kategori alat perangkat lunak yang ada dan alat mana yang menonjol...