Statistik dan Big Data

14
Bagaimana bisa terperangkap di sadel?

Saat ini saya agak bingung dengan bagaimana mini-batch gradient descent dapat terperangkap di titik sadel. Solusinya mungkin terlalu sepele sehingga saya tidak mengerti. Anda mendapatkan sampel baru setiap zaman, dan menghitung kesalahan baru berdasarkan batch baru, sehingga fungsi biaya hanya...

14
Bagaimana cara kerja L-BFGS?

Tujuan dari makalah ini adalah untuk mengoptimalkan beberapa parameter dengan memaksimalkan log-likelihood yang diatur. Kemudian mereka menghitung turunan parsial. Dan kemudian penulis menyebutkan bahwa mereka mengoptimalkan persamaan menggunakan L-BFGS, prosedur kuasi-Newton standar untuk...

14
Berapakah

Tentukan perkiraan lasso ß λ = arg min ß ∈ R p 1β^λ=argminβ∈Rp12n∥y−Xβ∥22+λ∥β∥1,β^λ=arg⁡minβ∈Rp12n‖y−Xβ‖22+λ‖β‖1,\hat\beta^\lambda = \arg\min_{\beta \in \mathbb{R}^p} \frac{1}{2n} \|y - X \beta\|_2^2 + \lambda \|\beta\|_1,manaithithi^{th}barisxi∈Rpxi∈Rpx_i \in \mathbb{R}^pdari matriks...

14
Caret glmnet vs cv.glmnet

Tampaknya ada banyak kebingungan dalam perbandingan menggunakan di glmnetdalam caretuntuk mencari lambda yang optimal dan menggunakan cv.glmnetuntuk melakukan tugas yang sama. Banyak pertanyaan diajukan, misalnya: Klasifikasi model train.glmnet vs. cv.glmnet? Apa cara yang tepat untuk...

14
Probabilitas bahwa Null Hipotesis Benar

Jadi, ini mungkin pertanyaan umum, tetapi saya belum pernah menemukan jawaban yang memuaskan. Bagaimana Anda menentukan probabilitas bahwa hipotesis nol itu benar (atau salah)? Katakanlah Anda memberi siswa dua versi ujian yang berbeda dan ingin melihat apakah versinya setara. Anda melakukan...