Statistik dan Big Data

9
Vektorisasi Rugi Entropi Silang

Saya berurusan dengan masalah yang berkaitan dengan menemukan gradien fungsi Cross entropy loss wrt parameter θθ\theta dimana: CE(θ)=−∑iyi∗log(y^i)CE(θ)=−∑iyi∗log(y^i)CE(\theta) = -\sum\nolimits_{i}{y_i*log({\hat{y}_{i}})} Dimana, y^i=softmax(θi)y^i=softmax(θi)\hat{y}_{i} = softmax(\theta_i) dan...

9
KNN: 1-tetangga terdekat

Pertanyaan saya adalah tentang pengelompokan tetangga terdekat 1 dan tentang pernyataan yang dibuat dalam buku The Elements of Statistics Learning, karya Hastie, Tibshirani, dan Friedman. Pernyataannya adalah (hlm. 465, bagian 13.3): "Karena hanya menggunakan titik pelatihan yang paling dekat...

9
Mengapa skor komponen utama tidak berkorelasi?

Anggaplah adalah matriks data yang berpusat pada rata-rata. Matriks S = cov ( A ) adalah m × m , memiliki m nilai eigen yang berbeda, dan vektor eigen s 1 , s 2 ... s m , yang ortogonal.SEBUAHSEBUAH\mathbf AS =cov( A )S=cov(SEBUAH)\mathbf S=\text{cov}(\mathbf A)m × mm×mm\times mmmms1s1\mathbf...

9
Membiarkan

Saya belajar mandiri pada teori model linier sekarang, dan satu hal yang saya temukan mengejutkan adalah meskipun didefinisikan untuk vektor acak , tidak disebutkan lagi momen-momen selanjutnya selain matriks kovarians.E[Y]E[Y]\mathbb{E}[\mathbf{Y}]Y=⎡⎣⎢⎢⎢⎢y1y2⋮yn⎤⎦⎥⎥⎥⎥Y=[y1y2⋮yn]\mathbf{Y} =...