Pertanyaan yang diberi tag r

25

Variabel bebas = variabel acak?

Saya sedikit bingung jika variabel independen (juga disebut prediktor atau fitur) dalam model statistik, misalnya dalam regresi linier , apakah variabel acak?Y = β 0 + β 1 XXXXY= β0+ β1XY=β0+β1XY=\beta_0+\beta_1

25

Apa kelebihan metrik Wasserstein dibandingkan dengan divergensi Kullback-Leibler?

Apa perbedaan praktis antara metrik Wasserstein dan divergensi Kullback-Leibler ? Metrik Wasserstein juga disebut sebagai jarak penggerak Bumi . Dari Wikipedia: Metrik Wasserstein (atau Vaserstein) adalah fungsi jarak yang didefinisikan antara distribusi probabilitas pada ruang metrik...

distributions kullback-leibler metric wasserstein

25

Apakah "model rintangan" benar-benar satu model? Atau hanya dua model berurutan yang terpisah?

Pertimbangkan model rintangan yang memprediksi data jumlah ydari prediktor normal x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 Dalam hal ini, saya memiliki...

r count-data zero-inflation

25

Apa perbedaan Cross-entropy dan KL divergence?

Kedua Cross-entropy dan KL divergence adalah alat untuk mengukur jarak antara dua distribusi probabilitas. Apa bedanya? H( P, Q ) = -∑xP( x ) logQ ( x )H(P,Q)=−∑xP(x)log⁡Q(x) H(P,Q) = -\sum_x P(x)\log Q(x) KL ( P| Q)=∑xP( x ) logP( x )Q ( x )KL(P|Q)=∑xP(x)log⁡P(x)Q(x) KL(P | Q) = \sum_{x}...

entropy kullback-leibler cross-entropy

25

Apakah bar kesalahan probabilitas memiliki arti?

Orang sering mengatakan beberapa peristiwa memiliki peluang 50-60% untuk terjadi. Kadang-kadang saya bahkan akan melihat orang memberikan bar kesalahan eksplisit tentang penetapan probabilitas. Apakah pernyataan-pernyataan ini memiliki makna atau apakah itu hanya kekhasan linguistik ketidaknyamanan...

probability error

24

Sanity check: seberapa rendah nilai p bisa?

Saya menggunakan uji ranksum untuk membandingkan rata-rata dua sampel ( ) dan telah menemukan bahwa mereka berbeda secara signifikan dengan: . Haruskah saya curiga dengan nilai- kecil atau haruskah saya menghubungkannya dengan kekuatan statistik tinggi yang terkait dengan memiliki sampel yang...

hypothesis-testing p-value sample-size power

24

Tes post hoc setelah ANOVA dengan tindakan berulang menggunakan R

Saya telah melakukan tindakan berulang ANOVA di R, sebagai berikut: aov_velocity = aov(Velocity ~ Material + Error(Subject/(Material)), data=scrd) summary(aov_velocity) Sintaks apa dalam R yang dapat digunakan untuk melakukan tes post hoc setelah ANOVA dengan tindakan berulang? Apakah tes Tukey...

r anova repeated-measures post-hoc contrasts

24

Mengapa lme dan aov mengembalikan hasil yang berbeda untuk tindakan berulang ANOVA di R?

Saya mencoba untuk beralih dari menggunakan ezpaket ke lmeuntuk tindakan berulang ANOVA (karena saya berharap saya akan dapat menggunakan kontras kustom dengan lme). Mengikuti saran dari posting blog ini saya dapat mengatur model yang sama menggunakan keduanya aov(seperti halnya ez, ketika...

r anova mixed-model repeated-measures lme4-nlme

24

Bagaimana melakukan regresi logistik pada R ketika hasilnya fraksional (rasio dua hitungan)?

Saya meninjau makalah yang memiliki eksperimen biologis berikut. Alat digunakan untuk mengekspos sel pada berbagai jumlah tegangan geser cairan. Saat tegangan geser yang lebih besar diterapkan ke sel, lebih banyak sel mulai terlepas dari substrat. Pada setiap tingkat tegangan geser, mereka...

r logistic multinomial

24

Bagaimana cara memvisualisasikan tabel kontingensi jarang yang sangat besar?

Saya memiliki dua variabel: Nama Obat (DN) dan Kejadian Buruk yang sesuai (AE), yang berdiri dalam hubungan banyak-ke-banyak. Ada 33.556 nama obat dan 9.516 efek samping. Ukuran sampel adalah sekitar 5,8 juta pengamatan. Saya ingin belajar dan memahami hubungan / hubungan antara DN dan AE. Saya...

r categorical-data data-visualization large-data association-measure

24

Bagaimana cara memasukkan istilah interaksi dalam GAM?

Kode berikut mengevaluasi kesamaan antara dua seri waktu: set.seed(10) RandData <- rnorm(8760*2) America <- rep(c('NewYork','Miami'),each=8760) Date = seq(from=as.POSIXct("1991-01-01 00:00"), to=as.POSIXct("1991-12-31 23:00"), length=8760) DatNew <- data.frame(Loc = America, Doy =...

r time-series data-visualization gam

24

Bagaimana merancang dan mengimplementasikan fungsi kerugian asimetris untuk regresi?

Masalah Dalam regresi satu biasanya menghitung mean squared error (MSE) untuk sampel: untuk mengukur kualitas prediktor.MSE = 1n∑i = 1n( g( xsaya) - gˆ( xsaya) )2MSE=1n∑saya=1n(g(xsaya)-g^(xsaya))2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n\left(g(x_i) - \widehat{g}(x_i)\right)^2 Saat ini saya...

regression error loss-functions

24

Bagaimana menentukan kuantil (isoline?) Dari distribusi normal multivariat

Saya tertarik pada bagaimana seseorang dapat menghitung kuantil dari distribusi multivariat. Dalam gambar, saya telah menggambar 5% dan 95% kuantil dari distribusi normal univariat yang diberikan (kiri). Untuk distribusi normal multivariat yang tepat, saya membayangkan analog akan menjadi isoline...

r pdf quantiles multivariate-normal multivariate-distribution

24

Apa model yang sesuai untuk data jumlah yang tidak terdispersi?

Saya mencoba untuk memodelkan data jumlah dalam R yang tampaknya kurang terdispersi (Dispersion Parameter ~ .40). Ini mungkin mengapa model glmdengan family = poissonatau binomial negatif ( glm.nb) tidak signifikan. Ketika saya melihat deskripsi data saya, saya tidak memiliki kemiringan data hitung...

r poisson-distribution negative-binomial beta-binomial underdispersion

24

Bayesian laso vs laso biasa

Perangkat lunak implementasi yang berbeda tersedia untuk laso . Saya tahu banyak membahas tentang pendekatan bayesian vs pendekatan frequentist di berbagai forum. Pertanyaan saya sangat spesifik untuk laso - Apa perbedaan atau kelebihan dari baysian laso vs laso biasa ? Berikut adalah dua contoh...

r machine-learning linear-model lasso

24

Apa itu 'koefisien alias'?

Saat membangun model regresi dalam R ( lm), saya sering mendapatkan pesan ini "there are aliased coefficients in the model" Apa sebenarnya artinya? Juga, karena ini predict()juga memberi peringatan. Meskipun ini hanya peringatan, saya ingin tahu bagaimana kita bisa mendeteksi / menghapus...

r regression

24

Algoritma untuk Deteksi Anomali Seri Waktu

Saat ini saya menggunakan AnomalyDetection Twitter di R: https://github.com/twitter/AnomalyDetection . Algoritma ini menyediakan deteksi anomali seri waktu untuk data dengan musiman. Pertanyaan: apakah ada algoritma lain yang mirip dengan ini (mengendalikan musiman tidak masalah)? Saya mencoba...

r regression time-series anomaly-detection

24

Apakah ini metode yang tepat untuk menguji efek musiman dalam data jumlah bunuh diri?

Saya memiliki 17 tahun (1995 hingga 2011) data sertifikat kematian yang terkait dengan kematian bunuh diri untuk sebuah negara bagian di AS. Ada banyak mitologi di luar sana tentang bunuh diri dan bulan / musim, banyak di antaranya kontradiktif, dan literatur saya. Sudah diulas, saya tidak...

r chi-squared arima count-data seasonality

24

Mengevaluasi regresi logistik dan interpretasi Hosmer-Lemeshow Goodness of Fit

Seperti kita ketahui, ada 2 metode untuk mengevaluasi model regresi logistik dan mereka menguji hal-hal yang sangat berbeda Kekuatan prediksi: Dapatkan statistik yang mengukur seberapa baik Anda dapat memprediksi variabel dependen berdasarkan variabel independen. Pseudo R ^ 2 yang terkenal...

r logistic goodness-of-fit regression-strategies model-evaluation

24

Beralih dari Memodelkan Proses menggunakan Distribusi Poisson untuk menggunakan Distribusi Binomial Negatif?

\newcommand{\P}{\mathbb{P}} Kami memiliki proses acak yang mungkin-atau-mungkin-tidak terjadi beberapa kali dalam jangka waktu TTT . Kami memiliki umpan data dari model yang sudah ada dari proses ini, yang menyediakan probabilitas sejumlah peristiwa yang terjadi pada periode 0≤t<T0≤t<T0 \leq...

negative-binomial kalman-filter poisson-process state-space-models