Statistik dan Big Data

23
Kekeliruan penembak jitu Texas dalam analisis data eksplorasi

Saya sedang membaca artikel ini di Nature di mana beberapa fallacy dijelaskan dalam konteks analisis data. Saya perhatikan bahwa kesalahan penembak jitu Texas sangat sulit untuk dihindari: Perangkap kognitif yang menunggu selama analisis data diilustrasikan oleh dongeng penembak jitu Texas:...

23
Apakah

Pertanyaan ini dimigrasikan dari Stack Overflow karena dapat dijawab di Cross Validated. Bermigrasi 3 tahun yang lalu . Dalam statistik kami melakukan regresi linier, yang paling awal dari mereka. Secara umum, kita tahu bahwa semakin tinggi R2R2R^2 semakin baik, tetapi

23
Properti PCA untuk pengamatan dependen

Kami biasanya menggunakan PCA sebagai teknik reduksi dimensi untuk data di mana kasus dianggap iid Pertanyaan: Apa nuansa khas dalam menerapkan PCA untuk data dependen dan non-iid? Apa sifat bagus / berguna PCA yang berlaku untuk data iid dikompromikan (atau hilang seluruhnya)? Sebagai contoh,...