Statistik dan Big Data

8
Jika

Salah satu asumsi untuk analisis regresi adalah XXX dan YYYtidak terjalin. Namun ketika saya memikirkannya, menurut saya masuk akal. Berikut ini sebuah contoh. Jika kami memiliki tes dengan 3 bagian (AB dan C). Skor tes keseluruhan sama dengan jumlah skor individu untuk 3 bagian. Sekarang masuk...

8
Penghentian awal vs validasi silang

Saat ini saya menggunakan penghentian awal dalam pekerjaan saya untuk mencegah pemasangan yang berlebihan. Khususnya yang diambil dari Early Stopping But When? . Saya sekarang ingin membandingkan dengan algoritma klasifikasi lain di mana tampak bahwa 10 kali validasi silang digunakan secara...

8
Apakah interval prediksi harus mengandung mean?

Saya mengalami masalah besar dengan masalah konseptual yang saya temukan. Katakanlah sebuah perusahaan memiliki distribusi yang sangat miring. Sesuatu yang mirip dengan eksponensial atau lognormal hanya lebih ekstrem. Sekarang berpura-pura distribusi sangat miring sehingga rata-rata distribusi...

8
Masalah dengan prediksi deret waktu

Saya mendapat pertanyaan tentang pemodelan seri waktu dalam R. data saya terdiri dari matriks berikut: 1 0.03333333 0.01111111 0.9555556 2 0.03810624 0.02309469 0.9387991 3 0.00000000 0.03846154 0.9615385 4 0.03776683 0.03119869 0.9310345 5 0.06606607 0.01201201 0.9219219 6 0.03900325 0.02058505...

8
Tinggi kurva distribusi normal

Untuk kurva distribusi normal 'berbentuk lonceng', orang akan berpikir bahwa ketinggian harus memiliki nilai ideal. Mengetahui nilai ini dapat menjadi salah satu indikator cepat untuk memeriksa apakah data terdistribusi secara normal. Namun, saya tidak dapat menemukan nilai formalnya. Sebagian...

8
Model pembelajaran mesin “Ekspor” dari R

Saya dapat membangun dan menerapkan model ML klasik pada pelatihan / set tes tradisional di R, tetapi bagaimana jika seorang mitra ingin mendapatkan model ini untuk menerapkan sistemnya sendiri (apa pun)? Menyimpan dan mengirim struktur model-R tidak membantu, tentu saja; dan mencari tahu mekanisme...

8
Probabilitas pasangan nilai yang berurutan

Mari X=(x1,x2,...x20)X=(x1,x2,...x20)X=(x_1, x_2,...x_{20}) dimana xi∼N(0,1)xi∼N(0,1)x_i\sim N(0,1) dan xi,xjxi,xjx_i, x_j independen ∀i≠j∀i≠j\forall i\neq j. Berapa probabilitas untuk mendapatkan sampel XXX di mana setidaknya ada dua nilai berturut-turut xixix_i dan xi+1xi+1x_{i+1} seperti...