Statistik dan Big Data

15
Skewness / kurtosis bergerak tertimbang eksponensial

Ada rumus on-line yang terkenal untuk menghitung rata-rata bergerak tertimbang secara eksponensial dan standar deviasi dari suatu proses (xn)n=0,1,2,…(xn)n=0,1,2,…(x_n)_{n=0,1,2,\dots} . Untuk rata-rata, μn=(1−α)μn−1+αxnμn=(1−α)μn−1+αxn\mu_n = (1-\alpha) \mu_{n-1} + \alpha x_n dan untuk...

15
Memahami k lag dalam uji R Dickey Fuller yang ditambah

Saya bermain-main dengan beberapa unit root testing di R dan saya tidak sepenuhnya yakin apa yang harus dilakukan dari parameter k lag. Saya menggunakan tes Dickey Fuller yang ditambah dan tes Philipps Perron dari paket tseries . Jelas parameter default (untuk ) hanya bergantung pada panjang seri....

15
Mempengaruhi fungsi dan OLS

Saya mencoba memahami bagaimana fungsi pengaruh bekerja. Bisakah seseorang menjelaskan dalam konteks regresi OLS sederhana yi=α+β⋅xi+εiyi=α+β⋅xi+εi\begin{equation} y_i = \alpha + \beta \cdot x_i + \varepsilon_i \end{equation} di mana saya ingin fungsi pengaruh untuk

15
Bagaimana memplot output data clustering?

Saya mencoba mengelompokkan satu set data (satu set tanda) dan mendapat 2 kluster. Saya ingin menggambarkannya secara grafis. Agak bingung dengan representasi, karena saya tidak punya koordinat (x, y). Juga mencari fungsi MATLAB / Python untuk melakukannya. EDIT Saya pikir memposting data...

15
Menerapkan regresi logistik dengan tingkat kejadian yang rendah

Saya memiliki dataset di mana tingkat kejadiannya sangat rendah (40.000 dari ). Saya menerapkan regresi logistik untuk ini. Saya telah berdiskusi dengan seseorang di mana keluar bahwa regresi logistik tidak akan memberikan matriks kebingungan yang baik pada data tingkat kejadian yang rendah. Tetapi...

15
Cara menghitung varians dari partisi variabel

Saya menjalankan eksperimen di mana saya mengumpulkan sampel (independen) secara paralel, saya menghitung varian masing-masing kelompok sampel dan sekarang saya ingin menggabungkan semua untuk menemukan varian total dari semua sampel. Saya mengalami kesulitan menemukan derivasi untuk ini karena...

15
Pilihan penalti yang optimal untuk laso

Apakah ada hasil analitik atau makalah eksperimental mengenai pilihan optimal dari koefisien hukuman ℓ1ℓ1\ell_1 . Secara optimal , maksud saya parameter yang memaksimalkan probabilitas memilih model terbaik, atau yang meminimalkan kerugian yang diharapkan. Saya bertanya karena seringkali tidak...

15
Cara TIDAK menggunakan statistik

Ini semacam pertanyaan terbuka tapi saya ingin jelas. Mengingat populasi yang cukup Anda mungkin dapat belajar sesuatu (ini adalah bagian terbuka) tetapi apa pun yang Anda pelajari tentang populasi Anda, kapan itu bisa berlaku untuk anggota populasi? Dari apa yang saya pahami tentang statistik,...