Statistik dan Big Data

10
Tertunda pada rangkaian waktu yang dikelompokkan

Saya memiliki beberapa puluh ribu pengamatan yang ada dalam rangkaian waktu tetapi dikelompokkan berdasarkan lokasi. Sebagai contoh: location date observationA observationB --------------------------------------- A 1-2010 22 12 A 2-2010 26 15 A 3-2010 45 16 A 4-2010 46 27 B 1-2010 167 48 B...

10
Menggandakan ekor dalam uji permutasi dua sampel

Misalkan kita memiliki dua sampel dan kami ingin menentukan apakah mereka diambil dari distribusi yang sama, sampel A, B yang terdiri dari beberapa kata bilangan bulat. Jika kita menguji ini menggunakan uji permutasi dua sampel, khususnya dengan melihat permutasi di mana perbedaan dalam rata-rata...

10
Nilai variabel tersembunyi regresi linear R "bernilai"

Ini hanya contoh yang saya temui beberapa kali, jadi saya tidak punya data sampel. Menjalankan model regresi linier di R: a.lm = lm(Y ~ x1 + x2) x1adalah variabel kontinu. x2bersifat kategorikal dan memiliki tiga nilai, mis. "Rendah", "Sedang" dan "Tinggi". Namun output yang diberikan oleh R akan...

10
Kemungkinan menemukan urutan pasangan basa tertentu

Memikirkan probabilitas selalu membuat saya menyadari betapa buruknya saya dalam menghitung ... Pertimbangkan urutan huruf dasar , masing-masing sama-sama cenderung muncul. Berapakah probabilitas bahwa urutan ini mengandung urutan tertentu dari pasangan basa dengan minat panjang ?nnnA ,T,C,  dan ...

10
Menggugat prior ... dengan uang!

Misalkan saya memiliki 'ahli', dari siapa saya ingin memperoleh distribusi sebelum pada beberapa variabel . Saya ingin memotivasi mereka dengan uang sungguhan . Idenya adalah untuk memperoleh prior, mengamati merealisasikan variabel acak , kemudian membagi beberapa 'dompet' yang telah ditentukan di...

10
Kuartil di Excel

Saya tertarik dengan definisi kuartil yang biasanya digunakan saat Anda menggunakan statistik dasar. Saya memiliki buku tipe Stat 101 dan hanya memberikan definisi intuitif. "Sekitar seperempat dari data jatuh pada atau di bawah kuartil pertama ..." Tapi, itu memberikan contoh di mana ia menghitung...

10
Regularisasi norma

Ada banyak metode untuk melakukan regularisasi - , , dan regularisasi berbasis misalnya. Menurut Friedman Hastie & Tibsharani , pembuat peraturan terbaik tergantung pada masalah: yaitu sifat fungsi target yang sebenarnya, dasar tertentu yang digunakan, rasio sinyal terhadap kebisingan, dan...

10
Apa perbedaan antara statistik dan informatika?

Kami selalu mengatakan bahwa statistik hanya berurusan dengan data. Tetapi kita juga tahu bahwa informatika juga mendapatkan pengetahuan dari analisis data. Sebagai contoh, orang-orang bioinformatika dapat sepenuhnya pergi tanpa biostatistik. Saya ingin tahu apa perbedaan mendasar antara statistik...