Statistik dan Big Data

15
Apa yang Anda lakukan untuk mengingat peraturan Bayes?

Saya pikir cara yang baik untuk mengingat rumus adalah dengan memikirkan rumus seperti ini: Probabilitas bahwa beberapa peristiwa A memiliki hasil tertentu yang diberikan peristiwa independen hasil B = probabilitas kedua hasil yang terjadi secara bersamaan / apa pun yang kita katakan probabilitas...

15
Termasuk Ketentuan Interaksi di Hutan Acak

Misalkan kita memiliki respons Y dan prediktor X1, ...., Xn. Jika kita mencoba mencocokkan Y melalui model linier X1, ...., Xn, dan kebetulan saja bahwa hubungan yang benar antara Y dan X1, ..., Xn tidak linier, kita mungkin dapat untuk memperbaiki model dengan mengubah X entah bagaimana dan...

15
Metrik untuk mengevaluasi algoritma peringkat

Saya tertarik melihat beberapa metrik yang berbeda untuk algoritme pemeringkatan - ada beberapa yang terdaftar di halaman wikipedia Learning to Rank, termasuk: • Rata-rata presisi rata-rata (MAP); • DCG dan NDCG; • Precision @ n, NDCG @ n, di mana "@n" menunjukkan bahwa metrik dievaluasi hanya...

15
Memahami Dekomposisi QR

Saya punya contoh yang berhasil (dalam R), yang saya coba mengerti lebih lanjut. Saya menggunakan Limma untuk membuat model linier dan saya mencoba memahami apa yang terjadi langkah demi langkah dalam perhitungan perubahan lipat. Saya kebanyakan berusaha mencari tahu apa yang terjadi untuk...

15
Pada Tingkat Apa tes

LATAR BELAKANG: Lewati dengan aman - ada di sini untuk referensi, dan untuk melegitimasi pertanyaan. Pembukaan makalah ini berbunyi: "Uji kontingensi chi-square Karl Pearson yang terkenal berasal dari statistik lain, yang disebut statistik z, berdasarkan pada distribusi Normal. Versi paling...

15
Bisakah model untuk data non-negatif dengan penggumpalan di nol (Tweedie GLM, GLM nol-inflasi, dll.) Memprediksi nol yang tepat?

Distribusi Tweedie dapat memodelkan data yang miring dengan massa titik pada nol saat parameter halhalp (eksponen dalam hubungan mean-variance) adalah antara 1 dan 2. Demikian pula model nol-meningkat (apakah kontinu atau diskrit) mungkin memiliki sejumlah besar nol. Saya mengalami kesulitan...

15
Kapan harus berhenti memperbaiki model?

I have been studying statistics from many books for the last 3 years, and thanks to this site I learned a lot. Nevertheless one fundamental question still remains unanswered for me. It may have a very simple or a very difficult answer, but I know for sure it requires some deep understanding of...

15
Pdf dari

Misalkan X1,X2,...,XnX1,X2,...,XnX_1, X_2,...,X_n menjadi iid dari N(μ,σ2)N(μ,σ2)N(\mu,\sigma^2) dengan μ∈Rμ∈R\mu \in \mathcal R dan σ 2 > 0 yang tidak diketahuiσ2>0σ2>0\sigma^2>0 Biarkan Z=X1−X¯S,Z=X1−X¯S,Z=\frac{X_1-\bar{X}}{S},S adalah standar deviasi di sini. Dapat ditunjukkan bahwa...