Statistik dan Big Data

14

Bagaimana seharusnya Seleksi Fitur dan optimasi Hyperparameter dipesan dalam pipa pembelajaran mesin?

Tujuan saya adalah mengklasifikasikan sinyal sensor. Konsep solusi saya sejauh ini adalah: i) Fitur teknik dari sinyal mentah ii) Memilih fitur yang relevan dengan ReliefF dan pendekatan pengelompokan iii) Menerapkan NN, Random Forest dan SVM Namun saya terjebak dalam dilema. Dalam ii) dan iii),...

feature-selection hyperparameter optimization

14

Apakah kita pernah menggunakan estimasi kemungkinan maksimum?

Saya bertanya-tanya apakah estimasi kemungkinan maksimum pernah digunakan dalam statistik. Kami belajar konsep itu tetapi saya bertanya-tanya kapan itu benar-benar digunakan. Jika kita mengasumsikan distribusi data, kita menemukan dua parameter, satu untuk mean dan satu untuk varians, tetapi apakah...

estimation maximum-likelihood

14

Apa sebenarnya perbedaan antara model parametrik dan non-parametrik?

Saya bingung dengan definisi model non-parametrik setelah membaca tautan ini Model parametrik vs Nonparametrik dan Menjawab komentar dari pertanyaan saya yang lain . Awalnya saya pikir "parametrik vs non-parametrik" berarti jika kita memiliki asumsi distribusi pada model (mirip dengan pengujian...

machine-learning neural-networks nonparametric terminology parametric

14

Apakah ada alasan matematis untuk konvolusi dalam jaringan saraf di luar kemanfaatan?

Dalam convolutional neural networks (CNN), matriks bobot pada setiap langkah mendapatkan baris dan kolom terbalik untuk mendapatkan matriks kernel, sebelum melanjutkan dengan konvolusi. Ini dijelaskan pada serangkaian video oleh Hugo Larochelle di sini : Menghitung peta yang tersembunyi akan...

machine-learning neural-networks conv-neural-network convolution

14

Intuisi untuk Mendukung Mesin Vektor dan hyperplane

Dalam proyek saya, saya ingin membuat model regresi logistik untuk memprediksi klasifikasi biner (1 atau 0). Saya memiliki 15 variabel, 2 di antaranya bersifat kategorikal, sedangkan sisanya adalah campuran variabel kontinu dan diskrit. Agar sesuai dengan model regresi logistik saya telah...

machine-learning logistic classification svm separation

14

Apa artinya regresi linier menjadi signifikan secara statistik tetapi memiliki r kuadrat yang sangat rendah?

Saya mengerti artinya bahwa model tersebut buruk dalam memprediksi titik data individu tetapi telah membentuk tren yang kuat (misalnya, y naik ketika x

regression inference r-squared linear

14

Penjelasan intuitif mengapa prosedur FDR Benjamini-Hochberg bekerja?

Apakah ada cara sederhana untuk menjelaskan mengapa prosedur Benjamini dan Hochberg (1995) benar-benar mengendalikan laju penemuan palsu (FDR)? Prosedur ini sangat elegan dan ringkas, namun bukti mengapa itu bekerja di bawah independensi (muncul dalam lampiran makalah 1995 mereka ) tidak sangat...

intuition false-discovery-rate teaching

14

Bagaimana bisa terperangkap di sadel?

Saat ini saya agak bingung dengan bagaimana mini-batch gradient descent dapat terperangkap di titik sadel. Solusinya mungkin terlalu sepele sehingga saya tidak mengerti. Anda mendapatkan sampel baru setiap zaman, dan menghitung kesalahan baru berdasarkan batch baru, sehingga fungsi biaya hanya...

gradient-descent sgd

14

Percobaan Bernoulli berkorelasi, distribusi Bernoulli multivariat?

Saya menyederhanakan pertanyaan penelitian yang saya miliki di tempat kerja. Bayangkan saya punya 5 koin dan mari kita sebut kepala sukses. Ini adalah koin yang SANGAT bias dengan probabilitas keberhasilan p = 0,1. Sekarang, jika koin-koin itu independen, kemudian mendapatkan probabilitas minimal 1...

multivariate-analysis bernoulli-distribution copula

14

Pemahaman intuitif tentang perbedaan antara konsisten dan tidak memihak asimtotik

Saya mencoba untuk mendapatkan pemahaman intuitif dan merasakan perbedaan dan perbedaan praktis antara istilah yang konsisten dan tidak memihak asimtotik. Saya tahu definisi matematika / statistik mereka, tetapi saya sedang mencari sesuatu yang intuitif. Bagi saya, melihat definisi masing-masing,...

bias convergence unbiased-estimator asymptotics intuition

14

Bagaimana Dropout Spatial dalam 2D diterapkan?

Ini dengan merujuk pada kertas Pelokalan Objek Efisien Menggunakan Jaringan Konvolusional , dan dari apa yang saya pahami dropout diimplementasikan dalam 2D. Setelah membaca kode dari Keras tentang bagaimana Dropout 2D Spasial diimplementasikan, pada dasarnya bentuk biner acak [batch_size, 1, 1,...

machine-learning deep-learning tensorflow dropout

14

Bagaimana cara kerja L-BFGS?

Tujuan dari makalah ini adalah untuk mengoptimalkan beberapa parameter dengan memaksimalkan log-likelihood yang diatur. Kemudian mereka menghitung turunan parsial. Dan kemudian penulis menyebutkan bahwa mereka mengoptimalkan persamaan menggunakan L-BFGS, prosedur kuasi-Newton standar untuk...

algorithms optimization

14

Berapakah

Tentukan perkiraan lasso ß λ = arg min ß ∈ R p 1β^λ=argminβ∈Rp12n∥y−Xβ∥22+λ∥β∥1,β^λ=arg⁡minβ∈Rp12n‖y−Xβ‖22+λ‖β‖1,\hat\beta^\lambda = \arg\min_{\beta \in \mathbb{R}^p} \frac{1}{2n} \|y - X \beta\|_2^2 + \lambda \|\beta\|_1,manaithithi^{th}barisxi∈Rpxi∈Rpx_i \in \mathbb{R}^pdari matriks...

lasso regularization

14

Melatih vs Kesenjangan Kesalahan Tes dan hubungannya dengan Overfitting: Merekonsiliasi saran yang bertentangan

Tampaknya ada saran yang bertentangan di luar sana tentang bagaimana menangani membandingkan kesalahan kereta vs tes, terutama ketika ada kesenjangan antara keduanya. Tampaknya ada dua aliran pemikiran yang bagi saya, tampaknya bertentangan. Saya ingin memahami cara mendamaikan keduanya (atau...

cross-validation overfitting

14

Berapa banyak kata 2 huruf yang bisa Anda dapatkan dari aabcccddef

(aa akan menjadi salah satu dari banyak, bb tidak akan) Saya pikir ini akan menjadi 10! / 8! Tapi ternyata saya melakukan sesuatu yang salah. Adakah yang bisa membantu saya karena saya

self-study combinatorics

14

Apakah ukuran efek benar-benar lebih baik daripada nilai-p?

Banyak penekanan ditempatkan pada mengandalkan dan melaporkan ukuran efek daripada nilai-p dalam penelitian terapan (misalnya kutipan lebih lanjut di bawah). Tapi bukankah itu ukuran efek seperti nilai-p adalah variabel acak dan karena itu dapat bervariasi dari sampel ke sampel ketika percobaan...

hypothesis-testing confidence-interval p-value effect-size

14

Caret glmnet vs cv.glmnet

Tampaknya ada banyak kebingungan dalam perbandingan menggunakan di glmnetdalam caretuntuk mencari lambda yang optimal dan menggunakan cv.glmnetuntuk melakukan tugas yang sama. Banyak pertanyaan diajukan, misalnya: Klasifikasi model train.glmnet vs. cv.glmnet? Apa cara yang tepat untuk...

r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

14

Penyetelan parameter hiper: Pencarian acak vs optimisasi Bayesian

Jadi, kita tahu bahwa pencarian acak berfungsi lebih baik daripada pencarian kisi, tetapi pendekatan yang lebih baru adalah optimasi Bayesian (menggunakan proses gaussian). Saya telah mencari perbandingan antara keduanya, dan tidak menemukan apa pun. Saya tahu bahwa di cs231n Stanford mereka hanya...

bayesian hyperparameter

14

Probabilitas bahwa Null Hipotesis Benar

Jadi, ini mungkin pertanyaan umum, tetapi saya belum pernah menemukan jawaban yang memuaskan. Bagaimana Anda menentukan probabilitas bahwa hipotesis nol itu benar (atau salah)? Katakanlah Anda memberi siswa dua versi ujian yang berbeda dan ingin melihat apakah versinya setara. Anda melakukan...

probability hypothesis-testing bayesian

14

Bagaimana cara melatih model LSTM pada beberapa data deret waktu?

Bagaimana cara melatih model LSTM pada beberapa data deret waktu? Kasus penggunaan: Saya memiliki penjualan mingguan 20.000 agen selama 5 tahun terakhir. Perlu memperkirakan penjualan mingguan mendatang untuk setiap agen. Apakah saya perlu mengikuti teknik pemrosesan batch - mengambil satu agen...

machine-learning time-series statistical-significance lstm artificial-intelligence