Statistik dan Big Data

14
GAM vs LOESS vs splines

Konteks : Saya ingin menggambar garis di sebar yang tidak tampak parametrik, oleh karena itu saya gunakan geom_smooth()di ggplotdalam R. Secara otomatis mengembalikan geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x'...

14
Cara memuluskan data dan memaksakan monotonitas

Saya memiliki beberapa data yang ingin saya smoothkan sehingga poin yang dihaluskan menurun secara monoton. Data saya menurun tajam dan kemudian mulai naik. Berikut ini contoh menggunakan R df <- data.frame(x=1:10, y=c(100,41,22,10,6,7,2,1,3,1)) ggplot(df, aes(x=x, y=y))+geom_line() Apa...

14
Perpustakaan Python Model Aditif Umum

Saya tahu bahwa R memiliki pustaka gam dan mgcv untuk model aditif umum. Tetapi saya mengalami kesulitan menemukan rekan-rekan mereka di ekosistem Python (statsmodels hanya memiliki prototipe di kotak pasir). Adakah yang tahu perpustakaan python yang ada? Siapa tahu ini mungkin proyek yang baik...

14
Tolok ukur kinerja untuk MCMC

Pernahkah ada studi skala besar metode MCMC yang membandingkan kinerja beberapa algoritma yang berbeda pada serangkaian kepadatan uji? Saya sedang memikirkan sesuatu yang setara dengan makalah Rios dan Sahinidis (2013), yang merupakan perbandingan menyeluruh dari sejumlah besar pengoptimalisasi...

14
Mengapa

Catatan: SSTSSTSST = Jumlah Total Kuadrat, SSESSESSE = Jumlah Kesalahan Kuadrat, dan SSRSSRSSR = Jumlah Regresi Kuadrat. Persamaan dalam judul sering ditulis sebagai: ∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2\sum_{i=1}^n (y_i-\bar y)^2=\sum_{i=1}^n...