Statistik dan Big Data

16
Kebingungan dengan tes Augmented Dickey Fuller

Saya bekerja pada kumpulan data electricityyang tersedia dalam paket R TSA. Tujuan saya adalah untuk mengetahui apakah suatu arimamodel akan sesuai untuk data ini dan pada akhirnya cocok. Jadi saya melanjutkan sebagai berikut: 1: Plot deret waktu yang dihasilkan jika grafik berikut: ke-2: Saya...

16
Harapan bersyarat dari R-squared

Pertimbangkan model linier sederhana: yy = X ′ ββ + ϵyy=X′ββ+ϵ\pmb{y}=X'\pmb{\beta}+\epsilon dimana ϵ i ∼ i . i . d .N ( 0 , σ 2 )ϵi∼i.i.d.N(0,σ2)\epsilon_i\sim\mathrm{i.i.d.}\;\mathcal{N}(0,\sigma^2) dan X ∈ R n × pX∈Rn×pX\in\mathbb{R}^{n\times p} , p ≥ 2p≥2p\geq2 dan XXX berisi kolom...

16
SVM satu kelas vs. SVM contoh

Saya mengerti bahwa satu kelas SVM (OSVM) diusulkan dengan tidak adanya data negatif dalam pikiran dan bahwa mereka berusaha untuk menemukan batas keputusan yang memisahkan set positif dan beberapa titik jangkar negatif, kata asalnya. Sebuah karya pada tahun 2011 mengusulkan Exemplar SVMs (ESVMs)...

16
Pilihan fitur dengan Hutan Acak

Saya memiliki dataset dengan sebagian besar variabel keuangan (120 fitur, 4k contoh) yang sebagian besar sangat berkorelasi dan sangat bising (indikator teknis, misalnya) jadi saya ingin memilih sekitar maks 20-30 untuk digunakan nanti dengan pelatihan model (klasifikasi biner - bertambah...