Statistik dan Big Data

9
Bagaimana mengatur ulang data 2D untuk mendapatkan korelasi?

Saya memiliki dataset sederhana berikut dengan dua variabel kontinu; yaitu: d = data.frame(x=runif(100,0,100),y = runif(100,0,100)) plot(d$x,d$y) abline(lm(y~x,d), col="red") cor(d$x,d$y) # = 0.2135273 Saya perlu mengatur ulang data agar memiliki korelasi antara variabel menjadi ~ 0,6. Saya...

9
Hitung kuantil jumlah distribusi dari kuantil tertentu

Mari kita asumsikan variabel acak independen yang pada tingkat tertentu diketahui melalui estimasi dari data: , ..., . Sekarang mari kita mendefinisikan variabel acak sebagai jumlah . Apakah ada cara untuk menghitung nilai kuantil dari jumlah pada level , yaitu, di ?NNNX1,...,XNX1,...,XNX_1, ...,...

9
Apakah Monte Carlo == menerapkan proses acak?

Saya tidak pernah memiliki kursus statistik formal tetapi karena jalur penelitian saya, saya terus-menerus menemukan artikel yang menerapkan beberapa konsep statistik. Seringkali saya akan melihat deskripsi proses Monte Carlo yang diterapkan pada situasi tertentu, dan untuk apa yang dapat saya...

9
Memilih simpul untuk GAM

Saat memilih jumlah simpul yang tepat untuk GAM, orang mungkin ingin mempertimbangkan jumlah data dan peningkatan pada sumbu x. Bagaimana jika kita memiliki 100 peningkatan pada sumbu x dengan 1000 titik data pada setiap kenaikan. Info di sini mengatakan: Jika tidak disediakan maka simpul...

9
Bagaimana seseorang memverifikasi sebab-akibat?

Setelah kami menunjukkan bahwa dua kuantitas berkorelasi, bagaimana kita menyimpulkan bahwa hubungan itu kausal? Dan selanjutnya yang mana yang menyebabkan apa? Sekarang dalam teori kita dapat menggunakan "tugas acak" (apa pun kata yang tepat), untuk memutus ikatan kecelakaan yang mungkin ada di...

9
Apa perbedaan antara berbagai pemecah pemrograman kuadratik R?

Saya mencari paket untuk membantu saya memecahkan beberapa masalah optimasi kuadratik dan saya melihat setidaknya ada setengah lusin paket yang berbeda. Menurut halaman ini : QP (Quadratic programming, 90C20): cplexAPI , kernlab , limSolve , LowRankQP , quadprog , Rcplex , Rmosek Beberapa di...

9
Berarti dipangkas vs median

Saya memiliki satu set data dengan semua panggilan yang dilakukan ke layanan darurat dan waktu respons dari departemen ambulans. Mereka mengakui bahwa ada beberapa kesalahan dengan waktu respons karena ada kasus di mana mereka tidak mulai merekam (jadi nilainya 0) atau di mana mereka tidak...