Statistik dan Big Data

10

Penjelasan intuitif untuk probabilitas terbalik dari bobot pengobatan (IPTW) dalam bobot skor kecenderungan?

Saya memahami mekanisme penghitungan bobot menggunakan skor kecenderungan : dan kemudian menerapkan bobot dalam analisis regresi, dan bahwa bobot berfungsi untuk "kendalikan" atau lepaskan pengaruh kovariat dalam populasi kelompok perlakuan dan kontrol dengan variabel hasil.w i , j = t r e a tp...

intuition weighted-regression propensity-scores

10

Apakah ada tes Kolmogorov-Smirnov dua sampel multivariat?

Apakah ada alternatif multivariat untuk uji dua sampel Kolmogorov-Smirnov ? Maksud saya adalah tes yang dapat digunakan untuk memeriksa setiap kali dua distribusi multidimensi yang mendasari

hypothesis-testing multivariate-analysis kolmogorov-smirnov

10

Mengambil sampel secara efisien distribusi Beta yang di-threshold

Bagaimana saya bisa mengambil sampel secara efisien dari distribusi berikut? x∼B(α,β), x>kx∼B(α,β), x>k x \sim B(\alpha, \beta),\space x > k Jika tidak terlalu besar maka penolakan sampel mungkin merupakan pendekatan terbaik, tetapi saya tidak yakin bagaimana untuk melanjutkan ketika...

random-generation beta-distribution truncation

10

Jeffrey sebelum kemungkinan binomial

Jika saya menggunakan Jeffreys sebelum untuk parameter probabilitas binomial maka ini berarti menggunakan distribusi .q ~ b e t a ( 1 / 2 , 1 / 2 )θθ\thetaθ∼beta(1/2,1/2)θ∼beta(1/2,1/2)\theta \sim beta(1/2,1/2) Jika saya bertransformasi ke kerangka referensi baru maka jelas juga tidak...

bayesian jeffreys-prior

10

Mengapa saya mendapatkan prediksi berbeda untuk ekspansi polinomial manual dan menggunakan fungsi R `poly`?

Mengapa saya mendapatkan prediksi berbeda untuk ekspansi polinomial manual dan menggunakan polyfungsi R ? set.seed(0) x <- rnorm(10) y <- runif(10) plot(x,y,ylim=c(-0.5,1.5)) grid() # xp is a grid variable for ploting xp <- seq(-3,3,by=0.01) x_exp <- data.frame(f1=x,f2=x^2) fit <-...

r regression polynomial

10

Bukti teorema Pitman – Koopman – Darmois

Di mana saya dapat menemukan bukti teorema Pitman – Koopman – Darmois? Saya telah mencari Google untuk beberapa waktu. Anehnya, banyak catatan menyebutkan teorema ini namun tidak satupun dari mereka yang

mathematical-statistics references inference sufficient-statistics

10

Pertanyaan wawancara ilmuwan data: Regresi linier rendah

Saya menghadapi pertanyaan wawancara untuk pekerjaan di mana pewawancara bertanya kepada saya kira sangat rendah (antara 5 hingga 10%) untuk model elastisitas harga. Bagaimana Anda memecahkan pertanyaan ini?R2R2R^2 Saya tidak bisa memikirkan hal lain selain fakta bahwa saya akan melakukan diagnosa...

regression self-study theory

10

Varian "Rata-rata"

Saya perlu mendapatkan semacam "rata-rata" di antara daftar varian, tetapi mengalami masalah dengan solusi yang masuk akal. Ada diskusi menarik tentang perbedaan di antara tiga cara Pythagoras (aritmatika, geometris, dan harmonik) di utas ini ; Namun, saya masih tidak merasa ada di antara mereka...

variance average

10

Mengapa kita tidak bisa menggunakan

Bayangkan kita memiliki model regresi linier dengan variabel dependen . Kami menemukan . Sekarang, kami melakukan regresi lain, tetapi kali ini di , dan juga menemukan . Saya telah diberitahu bahwa saya tidak dapat membandingkan kedua untuk melihat model mana yang lebih cocok. Mengapa demikian?...

regression data-transformation r-squared

10

Bagaimana skala Lasso dengan ukuran matriks desain?

Jika saya memiliki matriks desain , di mana adalah jumlah pengamatan dimensi , apa kompleksitas penyelesaian untuk dengan LASSO, wrt dan ? Saya pikir jawabannya harus merujuk pada bagaimana satu iterasi LASSO skala dengan parameter ini, daripada bagaimana jumlah iterasi (konvergensi) skala, kecuali...

optimization lasso regularization time-complexity

10

Perkirakan divergensi Kullback Leibler (KL) dengan monte carlo

Saya ingin memperkirakan perbedaan KL antara dua distribusi kontinu f dan g. Namun, saya tidak bisa menuliskan kepadatan untuk f atau g. Saya dapat mengambil sampel dari kedua f dan g melalui beberapa metode (misalnya, rantai markov monte carlo). Perbedaan KL dari f ke g didefinisikan seperti...

kullback-leibler

10

Perbedaan antara Priors yang tidak informatif dan tidak patut

Saya bertanya-tanya apa perbedaan antara kedua jenis prior ini: Tidak informatif Tidak

bayesian prior improper-prior

10

Mengapa kemiringan selalu tepat 1 ketika melakukan regresi kesalahan pada residu menggunakan OLS?

Saya sedang bereksperimen dengan hubungan antara kesalahan dan residu menggunakan beberapa simulasi sederhana dalam R. Satu hal yang saya temukan adalah bahwa, terlepas dari ukuran sampel atau varians kesalahan, saya selalu mendapatkan tepat untuk lereng ketika Anda cocok dengan model111 e r r o r...

regression least-squares residuals

10

Mengapa kesalahan standar proporsi, untuk n yang diberikan, terbesar untuk 0,5?

Kesalahan standar proporsi akan menjadi yang terbesar untuk N yang diberikan ketika proporsi yang dimaksud adalah 0,5, dan semakin kecil semakin jauh proporsinya dari 0,5. Saya bisa melihat mengapa ini terjadi ketika saya melihat persamaan untuk kesalahan standar proporsi, tapi saya tidak bisa...

standard-error proportion intuition

10

Apa beberapa "makalah awal" yang paling penting tentang metode Regularisasi?

Dalam beberapa jawaban saya telah melihat pengguna CrossValidated menyarankan OP menemukan makalah awal tentang Lasso, Ridge, dan Elastic Net. Untuk anak cucu, apa saja karya mani di Lasso, Ridge, dan Elastic Net?

references lasso regularization ridge-regression elastic-net

10

Bingung dan lintas-entropi untuk model n-gram

Mencoba memahami hubungan antara entropi-silang dan kebingungan. Secara umum untuk model M , Perplexity (M) = 2 ^ entropy (M) . Apakah hubungan ini berlaku untuk semua n-gram yang berbeda, yaitu unigram, bigram,

natural-language entropy perplexity

10

WaveNet bukanlah konvolusi yang melebar, bukan?

Dalam makalah WaveNet baru-baru ini , penulis merujuk pada model mereka yang memiliki tumpukan lapisan konvolusi melebar. Mereka juga menghasilkan bagan berikut, menjelaskan perbedaan antara konvolusi 'reguler' dan konvolusi dilatasi. Konvolusi reguler terlihat seperti Ini adalah konvolusi...

neural-networks deep-learning conv-neural-network tensorflow

10

Regularisasi: mengapa dikalikan dengan 1 / 2m?

Dalam minggu 3 catatan kuliah dari kelas Coursera Machine Learning Andrew Ng , istilah ditambahkan ke fungsi biaya untuk melaksanakan regularisasi: J+( θ ) = J( θ ) + λ2 m∑j = 1nθ2jJ+(θ)=J(θ)+λ2m∑j=1nθj2J^+(\theta) = J(\theta) + \frac{\lambda}{2m} \sum_{j=1}^n \theta_j^2 Catatan kuliah...

regularization

10

Model Final dari Time Series Cross Validation

Saya memiliki pengalaman sebelumnya dengan validasi silang K-fold 'normal' untuk tuning model dan saya sedikit bingung dengan aplikasi dalam model time-series. Ini adalah pemahaman saya bahwa untuk model deret waktu konsekuensi wajar untuk cross-validasi adalah prosedur 'asal-usul ke depan' yang...

time-series forecasting cross-validation

10

Clustering sebagai reduksi dimensi

Saya membaca buku "Machine learning with Spark" oleh Nick Pentreath, dan di halaman 224-225 penulis membahas tentang penggunaan K-means sebagai bentuk pengurangan dimensionalitas. Saya belum pernah melihat pengurangan dimensi seperti ini, apakah ada nama atau / dan berguna untuk bentuk data...

clustering k-means dimensionality-reduction