Statistik dan Big Data

9
Interval kepercayaan vs ukuran sampel?

Saya benar-benar baru dalam statistik dan bidang interval kepercayaan. Jadi ini mungkin sangat sepele atau bahkan terdengar bodoh. Saya akan sangat menghargai jika Anda dapat membantu saya memahami atau mengarahkan saya ke beberapa literatur / teks / blog yang menjelaskan hal ini dengan lebih...

9
Menentukan kontributor terbesar dalam suatu grup

Saya tidak tahu banyak tentang statistik jadi bersabarlah. Katakanlah saya memiliki 1000 pekerja. Saya ingin mengetahui siapa pekerja yang paling sulit, tetapi saya hanya bisa mengukur jumlah pekerjaan yang dilakukan dalam kelompok 1-100 selama satu jam kerja. Dengan asumsi setiap pekerja selalu...

9
Distribusi pada himpunan bagian dari

Saya ingin tahu apakah ada jenis distribusi standar pada himpunan bilangan bulat . Secara ekuivalen, kita dapat menyatakan ini sebagai distribusi pada vektor panjang dari hasil biner, misalnya jika maka sesuai dengan vektor .{1,2,...,J}{1,2,...,J}\{1, 2, ..., J\}JJJJ=5J=5J = 5{1,3,5}{1,3,5}\{1, 3,...

9
Cara memplot data harian 20 tahun dalam deret waktu

Saya memiliki dataset berikut: https://dl.dropbox.com/u/22681355/ORACLE.csv dan ingin merencanakan perubahan harian di 'Buka' dengan 'Tanggal', jadi saya melakukan hal berikut: oracle <- read.csv(file="http://dl.dropbox.com/u/22681355/ORACLE.csv", header=TRUE) plot(oracle$Date, oracle$Open,...

9
Bagaimana saya bisa menjelaskan intuisi di balik ANOVA?

Saya perlu menjelaskan intuisi di balik apa yang dilakukan ANOVA kepada orang non-teknis. Apakah ada visual yang menjelaskan ide itu? Visual yang menggambarkan ide kunci dalam konteks ANOVA satu arah dengan level 3 faktor mungkin mungkin membantu? Mari kita anggap bahwa orang tersebut telah...

9
Box Cox Transforms untuk regresi

Saya mencoba menyesuaikan model linier pada beberapa data hanya dengan satu prediktor (katakanlah (x, y)). Data sedemikian rupa sehingga untuk nilai x yang kecil, nilai y memberikan kesesuaian yang ketat dengan garis lurus, namun begitu nilai x meningkat, nilai y menjadi lebih tidak stabil. Berikut...

9
Dari mana fungsi Gaussian berasal?

Saya telah membaca banyak halaman di google dan tidak dapat menemukan jawaban yang memuaskan. Saya juga membaca http://castatistics.wikispaces.com/file/view/normal+der..pdf , tapi saya ragu itu adalah motivasi asli untuk fungsi Gaussian. Saat ini saya seorang sarjana dan buku teks saya hanya...

9
Kebingungan terkait dengan teknik mengantongi

Saya mengalami sedikit kebingungan. Saya sedang membaca makalah ini di mana dijelaskan bahwa teknik mengantongi sangat mengurangi varians dan hanya sedikit meningkatkan bias. Saya tidak mengerti mengapa mengurangi varians. Saya tahu perbedaan dan biasnya. Bias adalah ketidakmampuan model untuk...

9
Belajar dari data relasional

Pengaturan Banyak algoritma beroperasi pada satu relasi atau tabel, sementara banyak database dunia nyata menyimpan informasi dalam beberapa tabel (Domingos, 2003). Pertanyaan Jenis algoritma apa yang dipelajari dengan baik dari beberapa tabel (relasional). Secara khusus, saya tertarik pada...