Statistik dan Big Data

9
Kinerja terbaik yang diharapkan pada kumpulan data

Katakanlah saya punya masalah pembelajaran mesin sederhana seperti klasifikasi. Dengan beberapa tolok ukur dalam penglihatan atau pengenalan audio, saya, sebagai manusia, adalah penggolong yang sangat baik. Karena itu saya memiliki intuisi tentang seberapa bagus classifier bisa didapat. Tetapi...

9
Bagaimana cara kerja imputasi tikus?

Saya bertanya-tanya apakah ada yang punya pengalaman menggunakan fungsi mouse, seperti yang dijelaskan dalam mouse: Imputasi Multivarian oleh Chained Equations di R (JSS 2011 45 (3))? Saya memiliki dataset dengan sejumlah variabel, masing-masing dengan berbagai tingkat data yang hilang. Pertanyaan...

9
Bootstrap parametrik, semiparametrik, dan nonparametrik untuk model campuran

Cangkok berikut diambil dari artikel ini . Saya pemula untuk bootstrap dan mencoba mengimplementasikan bootstrap parametrik, semiparametrik, dan nonparametrik untuk model campuran linier dengan R bootpaket. Kode R Ini Rkode saya : library(SASmixed) library(lme4) library(boot) fm1Cult...

9
Menghasilkan variabel acak memenuhi batasan

Saya perlu membuat daftar variabel acak tunduk pada kendala yang dapat diekspresikan dalam bentuk E x = b di mana E adalah matriks m × n jika x memiliki n entri. Dalam semua kasus yang saya hadapi, n > > m , misalnya n akan menjadi sekitar 14.000 dan m akan 50. Saya tidak yakin metode apa...

9
Kebingungan tentang kriging

Saya sedang membaca artikel wikipedia ini terkait dengan kriging. Saya tidak mengerti bagian ketika mengatakan itu Kriging menghitung terbaik linear berisi , dari Z ( x 0 ) sehingga kriging varians dari diminimalkan dengan kondisi unbiasedness. Saya tidak mendapatkan derivasi dan juga bagaimana...

9
Mean square error atau mean squared error

Sebagai penutur bahasa Inggris non-pribumi saya bertanya-tanya mana dari ekspresi persegi atau kuadrat yang harus saya gunakan. Misalnya dalam mean square error atau mean squared error. Menurut internet, tampaknya kedua bentuk tersebut digunakan secara tidak jelas. Apakah satu ungkapan lebih...

9
Mensimulasikan distribusi

Saya sedang mengerjakan tugas Perencanaan Kapasitas dan saya telah membaca beberapa buku. Ini khusus tentang distribusi. Saya menggunakan R. Apa pendekatan yang direkomendasikan untuk mengidentifikasi apa distribusi data saya? Apakah ada metode statistik untuk mengidentifikasinya? Saya punya...

9
Bagaimana saya bisa memperkirakan interval kepercayaan 95% menggunakan profil untuk parameter yang diestimasi dengan memaksimalkan fungsi log-likelihood menggunakan optim di R?

Bagaimana saya bisa memperkirakan interval kepercayaan 95% menggunakan profil untuk parameter yang diestimasi dengan memaksimalkan fungsi log-likelihood menggunakan optim di R? Saya tahu saya dapat secara asimtotik memperkirakan matriks kovarians dengan membalik goni , tetapi saya khawatir bahwa...