Statistik dan Big Data

11
Bisakah meningkat ketika

Jika β∗=argminβ∥y−Xβ∥22+λ∥β∥1β∗=argminβ‖y−Xβ‖22+λ‖β‖1\beta^*=\mathrm{arg\,min}_{\beta} \|y-X\beta\|^2_2+\lambda\|\beta\|_1 , dapat ∥β∗∥2‖β∗‖2\|\beta^*\|_2 meningkat saat λλ\lambda meningkat? Saya pikir ini mungkin. Meskipun ∥β∗∥1‖β∗‖1\|\beta^*\|_1 tidak meningkat ketika λλ\lambda meningkat ( bukti...

11
Roll die 6-sided sampai total

Inilah pertanyaannya: Anda melempar dadu 6 sisi yang adil secara iteratif sampai jumlah gulungan dadu lebih besar dari atau sama dengan M. Apa rata-rata dan standar deviasi jumlah dikurangi M ketika M = 300? Haruskah saya menulis kode untuk menjawab pertanyaan semacam ini? Tolong beri saya...

11
Memahami rumus diferensiasi fraksional

Saya memiliki waktu seri dan saya ingin model itu sebagai proses ARFIMA (alias Farima). Jika y t terintegrasi dari (pecahan) agar d , saya ingin fraksional-perbedaan itu untuk membuatnya diam.ytyty_tytyty_tddd Pertanyaan : apakah rumus berikut ini mendefinisikan pembeda fraksional...

11
mendapatkan derajat kebebasan dari Lmer

Saya sudah cocok dengan model lmer dengan yang berikut ini (walaupun dibuat keluaran): Random effects: Groups Name Std.Dev. day:sample (Intercept) 0.09 sample (Intercept) 0.42 Residual 0.023 Saya benar-benar ingin membangun interval kepercayaan untuk setiap efek menggunakan rumus...

11
Rantai Markov vs. HMM

Rantai Markov masuk akal bagi saya, saya bisa menggunakannya untuk memodelkan perubahan keadaan probabilistik dalam masalah kehidupan nyata. Lalu datanglah HMM. HMM dikatakan lebih cocok untuk memodelkan banyak masalah daripada MC. Namun, masalah yang orang sebutkan agak rumit untuk dipahami...

11
Perbedaan Berarti vs Perbedaan Berarti

Ketika mempelajari dua sampel independen berarti, kita diberitahu bahwa kita sedang melihat "perbedaan dua rata-rata". Ini berarti kami mengambil rata-rata dari populasi 1 ( ) dan mengurangi rata-rata dari populasi 2 ( ). Jadi, "perbedaan dua cara" kami adalah ( - ). ˉ y 2 ˉ y 1 ˉ y 2y¯1y¯1\bar...

11
Membagi data menjadi N kelompok yang sama

Saya memiliki kerangka data yang berisi nilai di 4 kolom: Sebagai contoh: ID, price, click count,rating Yang ingin saya lakukan adalah "memecah" kerangka data ini menjadi N grup yang berbeda di mana setiap grup akan memiliki jumlah baris yang sama dengan distribusi harga, jumlah klik dan atribut...

11
Bagaimana menafsirkan plot kotak berlekuk

Sambil melakukan beberapa EDA saya memutuskan untuk menggunakan plot kotak untuk menggambarkan perbedaan antara dua tingkat faktor. Cara ggplot membuat plot kotak cukup memuaskan, tetapi sedikit sederhana (plot pertama di bawah). Sementara meneliti karakteristik plot kotak saya mulai bereksperimen...

11
Nilai p keseluruhan dan nilai p berpasangan?

Saya telah memasang model linear umum yang kemungkinan lognya adalah L u .y=β0+β1x1+β2x2+β3x3,y=β0+β1x1+β2x2+β3x3,y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3,LuL.kamuL_u Sekarang saya ingin menguji apakah koefisiennya sama. Pertama, uji keseluruhan : kemungkinan log dari model tereduksi adalah...