Statistik dan Big Data

8
Interval kepercayaan saat menggunakan teorema Bayes

Saya menghitung beberapa probabilitas bersyarat, dan interval kepercayaan 95% yang terkait. Untuk banyak kasus saya, saya memiliki jumlah xkeberhasilan langsung dari npercobaan (dari tabel kontingensi), sehingga saya dapat menggunakan interval kepercayaan Binomial, seperti yang disediakan oleh...

8
Memahami masalah Behrens – Fisher

Bagian dari artikel ini mengatakan: Ronald Fisher pada tahun 1935 memperkenalkan inferensi fidusia untuk menerapkannya pada masalah ini. Dia merujuk pada makalah sebelumnya oleh WV Behrens dari tahun 1929. Behrens dan Fisher mengusulkan untuk menemukan distribusi probabilitas mana dan adalah...

8
mendeteksi plagiarisme pada tes pilihan ganda

Misalkan invigilator mencurigai satu siswa menyalin jawaban dari kertas siswa lain selama ujian pilihan ganda. Dia kemudian memeriksa jawaban mereka dan menemukan beberapa kesamaan — tetapi di sisi lain, pasti ada kesamaan karena sifat ujian. Bagaimana seharusnya dia menentukan apakah kecurigaannya...

8
Apa peluang tiga orang untuk berulang tahun berturut-turut?

Seseorang berbincang-bincang bahwa tiga temannya berulang tahun berturut-turut (seperti 10, 11, dan 12 November), dan saya ingin mengetahui seberapa besar kemungkinan itu untuk tiga orang yang dipilih secara acak, dengan asumsi bahwa hari ulang tahun didistribusikan secara acak dan ulang tahun dua...

8
Menghitung presisi dan daya ingat dalam R

Misalkan saya sedang membangun classifier regresi logistik yang memprediksi apakah seseorang sudah menikah atau lajang. (1 = menikah, 0 = tunggal) Saya ingin memilih titik pada kurva presisi-ingat yang memberi saya setidaknya 75% presisi, jadi saya ingin memilih ambang dan ,

8
Distribusi normal standar pada subruang

Membiarkan U⊂RnU⊂RnU \subset \mathbb{R}^n menjadi ruang vektor dengan redup( U) = ddim⁡(U)=d\dim(U)=d. Distribusi normal standar aktifUUU adalah hukum vektor acak X= (X1, ... ,Xn)X=(X1,…,Xn)X=(X_1, \ldots, X_n) mengambil nilai dalam UUU dan sedemikian rupa sehingga koordinat XXX jadi satu (⟺⟺\iff...

8
Garis lurus paralel pada plot sisa vs pas

Saya memiliki masalah regresi berganda, yang saya coba selesaikan menggunakan regresi berganda sederhana: model1 <- lm(Y ~ X1 + X2 + X3 + X4 + X5, data=data) Ini sepertinya menjelaskan 85% varian (menurut R-squared) yang tampaknya cukup bagus. Namun yang membuat saya khawatir adalah plot aneh...