Statistik dan Big Data

8
Metrik jarak dan kutukan dimensi

Beberapa tempat saya membaca catatan bahwa jika Anda memiliki banyak parameter dan Anda mencoba menemukan "metrik kesamaan" antara vektor-vektor ini, Anda mungkin memiliki "kutukan dimensioality". Saya percaya itu berarti sebagian besar skor kesamaan akan sama dan tidak memberi Anda informasi yang...

8
Makalah / contoh penambangan data

Saya mencari beberapa makalah / situs panjang / menengah / panjang tentang penambangan data, khususnya di mana satu dataset dieksplorasi secara mendalam dari persiapan data hingga model akhir. Saya sangat tertarik dalam diskusi tentang penerapan algo pembelajaran mesin dan juga pemodelan data...

8
Apa saja penggunaan matriks padat dalam statistik?

OK, saya bukan ahli statistik (bahkan tidak dekat). Saya seorang peneliti Komputasi Kinerja Tinggi dan saya ingin beberapa kasus uji untuk Matriks Padat Besar (Lebih dari 5000x5000). Saya telah bertanya di sini dan beberapa tempat lain tetapi tidak pernah mendapat jawaban dari ahli statistik. Saya...

8
Memahami analisis faktor

Dapatkah saya memahami analisis faktor dengan cara berikut? Asumsikan saya memiliki 5 variabel independen (A, B, C, D, E) Analisis faktor memungkinkan saya untuk membuat (D, E) menjadi variabel dependen dan memungkinkan saya untuk membuatnya menjadi kombinasi linear dari (A, B, C). Karena itu...

8
Bingung dengan implementasi ridge MATLAB

Saya memiliki dua implementasi berbeda ridgedi MATLAB. Hanya satu x=(A′A+Iλ)−1A′bx=(A′A+Iλ)−1A′b\mathbf x = (\mathbf{A}'\mathbf{A}+\mathbf{I}\lambda)^{-1}\mathbf{A}'\mathbf b (seperti yang terlihat di halaman regresi ridge Wikipedia ), denganII\mathbf{I} menjadi matriks identitas kolom ukuran...

8
Distribusi sampel dari penaksir efek acak

Saya telah membaca bahwa distribusi untuk estimator efek acak di lme4 sangat miring dan untuk alasan ini kesalahan standar tidak dilaporkan. Saya ingin tahu apakah ada yang bisa memberikan referensi untuk ini? Saya memiliki akses ke buku karya Bates dan Pinherio, tetapi tidak untuk Raudenbush dan...

8
Model pembelajaran berpasangan open-source

Saya memecahkan masalah klasifikasi menggunakan set pelatihan pembelajaran berpasangan. Kami memiliki 2 kelas: buruk dan baik . Kami juga memiliki pasangan objek , yang berarti objek lebih baik daripada . Setiap objek dijelaskan melalui koordinat aslinya: . Tujuan saya adalah membangun algoritma...

8
Interval kepercayaan untuk polinomial

Saya memiliki variabel acak ZZZ yang mengambil nilai dalam bilangan bulat tidak negatif {0,1,2,…}{0,1,2,…}\{ 0,1,2,\dots \}, panggil probabilitas untuk setiap hasil zk:=P[Z=k]zk:=P[Z=k]z_k:=P[Z=k]. Saya dapat mencicipi dariZZZDistribusi secara mandiri dan murah; Saat ini saya memiliki ukuran...

8
Deteksi bentuk untuk data deret waktu

Saya memiliki banyak koleksi rangkaian waktu - pengukuran dilakukan setiap 15 menit (96 pengukuran dalam sehari) selama rentang 1 tahun di berbagai lokasi berbeda. Saya telah membagi setiap deret waktu menjadi 365 deret waktu lebih kecil, 1 untuk setiap hari dalam setahun. Melihat deret waktu ini,...