Statistik dan Big Data

11
Menemukan titik GPS rata-rata

Saya perlu menulis sebuah program untuk menemukan titik GPS rata-rata dari populasi titik. Dalam praktiknya hal berikut terjadi: Setiap bulan seseorang merekam titik GPS dari aset statis yang sama. Karena sifat GPS, titik-titik ini sedikit berbeda setiap bulan. Kadang-kadang orang membuat...

11
Kemungkinan seseorang akan menyukai gambar

Saya punya masalah berikut: - Kami telah menetapkan N orang - Kami telah menetapkan gambar K - Setiap orang memberi peringkat sejumlah gambar. Seseorang mungkin suka atau tidak suka gambar (ini adalah dua kemungkinan). - Masalahnya adalah bagaimana menghitung kemungkinan bahwa beberapa orang...

11
Bagaimana cara melakukan uji-t dengan sampel besar?

Saya memiliki dua populasi, Satu dengan N = 38.704 (jumlah pengamatan) dan lainnya dengan N = 1.313.662. Set data ini memiliki ~ 25 variabel, semuanya bersambungan. Saya mengambil rata-rata dari setiap set data dan menghitung statistik uji menggunakan rumus t = rata-rata perbedaan / kesalahan std...

11
Menafsirkan output langkah dalam R

Dalam R, stepperintah ini dimaksudkan untuk membantu Anda memilih variabel input ke model Anda, bukan? Berikut ini berasal dari example(step)#-> swiss& step(lm1) > step(lm1) Start: AIC=190.69 Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum...

11
Secara otomatis menghasilkan ringkasan dengan variabel faktor dalam R

Saya punya kerangka data seperti berikut: case simulation temp plank oxygen 1 1 1 8 7 11 2 2 1 16 10 15 ... 17 17 2 26 12 17 18 18 2 15 8 12 19 19 2 28 11 21 20 20 2 24 6 14 Saya ingin membagi ringkasan berdasarkan level dari variabel simulasi. Sebagai contoh, saya ingin rata-rata tempuntuk...

11
Bagaimana Anda menguji implementasi k-means?

Penafian: Saya memposting pertanyaan ini di Stackoverflow, tapi saya pikir mungkin ini lebih cocok untuk platform ini. Bagaimana Anda menguji implementasi k-means Anda sendiri untuk set data multidimensi? Saya sedang berpikir untuk menjalankan implementasi yang sudah ada (yaitu, Matlab) pada data...

11
Memperkirakan parameter model linear yang dinamis

Saya ingin menerapkan (dalam R) Model Dynamic Linear berikut yang sangat sederhana yang saya punya 2 parameter waktu yang tidak diketahui (varian kesalahan pengamatan dan varian kesalahan negara ).ϵ1tϵt1\epsilon^1_tϵ2tϵt2\epsilon^2_t Ytθt+1==θt+ϵ1tθt+ϵ2tYt=θt+ϵt1θt+1=θt+ϵt2 \begin{matrix} Y_t &...

11
Varian dari dua variabel acak tertimbang

Membiarkan: Simpangan baku variabel acak A=σ1=5A=σ1=5A =\sigma_{1}=5 Simpangan baku variabel acak B=σ2=4B=σ2=4B=\sigma_{2}=4 Maka varian A + B adalah: Var(w1A+w2B)=w21σ21+w22σ22+2w1w2p1,2σ1σ2Var(w1A+w2B)=w12σ12+w22σ22+2w1w2p1,2σ1σ2Var(w_{1}A+w_{2}B)=