Statistik dan Big Data

19
Pengelompokan data tipe campuran dengan R

Terkunci . Pertanyaan ini dan jawabannya dikunci karena pertanyaannya di luar topik tetapi memiliki signifikansi historis. Saat ini tidak menerima jawaban atau interaksi baru. Saya bertanya-tanya apakah mungkin untuk melakukan dalam R clustering data yang memiliki

19
Goodness of fit untuk histogram 2D

Saya memiliki dua set data yang mewakili parameter bintang: satu yang diamati dan yang dimodelkan. Dengan set ini saya membuat apa yang disebut diagram dua warna (TCD). Sampel dapat dilihat di sini: A menjadi data yang diamati dan B data diekstraksi dari model (apalagi garis hitam, titik...

19
Apa itu entropi empiris?

Dalam definisi set bersama (dalam "Elemen Teori Informasi", bab 7.6, hal. 195), kita menggunakan np(xn)=∏ n i = 1 p(xi)- 1ncatatanp ( xn)-1ncatatan⁡hal(xn)-\frac{1}{n} \log{p(x^n)} sebagai entropi empiris dari sebuah -berikutnya dengan . Saya tidak pernah menemukan terminologi ini sebelumnya. Itu...

19
Apa definisi distribusi simetris?

Apa definisi distribusi simetris? Seseorang mengatakan kepada saya bahwa variabel acak berasal dari distribusi simetris jika dan hanya jika dan memiliki distribusi yang sama. Tetapi saya pikir definisi ini sebagian benar. Karena saya dapat menyajikan contoh tandingan dan . Jelas, ia memiliki...

19
Stabilitas validasi silang dalam model Bayesian

Saya memasang HLM Bayesian di JAGS menggunakan k-fold cross-validation (k = 5). Saya ingin tahu apakah estimasi parameter stabil di semua lipatan. Apa cara terbaik untuk melakukan ini?ββ\beta Satu ide adalah untuk menemukan perbedaan dari posteriors dari dan untuk melihat apakah 0 berada di 95% CI...

19
Apa pentingnya fungsi dalam statistik?

Di kelas kalkulus saya, kami menjumpai fungsi , atau "kurva lonceng", dan saya diberi tahu bahwa ia memiliki aplikasi yang sering dalam statistik.e- x2e-x2e^{-x^2} Karena penasaran, saya ingin bertanya: Apakah fungsi benar-benar penting dalam statistik? Jika demikian, apa masalahnya dengan yang...

19
Mengapa regresi tentang varians?

Saya membaca catatan ini . Pada halaman 2, ini menyatakan: "Berapa banyak varian dalam data dijelaskan oleh model regresi yang diberikan?" "Interpretasi regresi adalah tentang rata-rata koefisien; kesimpulannya adalah tentang varians mereka." Saya telah membaca tentang pernyataan seperti...