Statistik dan Big Data

10
Revolusi dalam statistik selama 50 tahun terakhir? [Tutup]

Seperti yang ada saat ini, pertanyaan ini tidak cocok untuk format Tanya Jawab kami. Kami berharap jawaban didukung oleh fakta, referensi, atau keahlian, tetapi pertanyaan ini kemungkinan akan mengundang debat, argumen, polling, atau diskusi panjang. Jika Anda merasa bahwa

10
Bandwidth kernel dalam estimasi kepadatan kernel

Saya melakukan beberapa estimasi kepadatan Kernel, dengan titik-titik tertimbang yang ditetapkan (mis., Masing-masing sampel memiliki bobot yang tidak diperlukan), dalam dimensi N. Juga, sampel ini hanya dalam ruang metrik (mis., Kita dapat menentukan jarak di antara mereka) tetapi tidak ada yang...

10
Output dari model logistik di R

Saya mencoba menafsirkan tipe model logistik berikut: mdl <- glm(c(suc,fail) ~ fac1 + fac2, data=df, family=binomial) Apakah output dari predict(mdl)peluang keberhasilan yang diharapkan untuk setiap titik data? Apakah ada cara sederhana untuk menabulasi peluang untuk setiap tingkat faktor...

10
Distribusi asimtotik multinomial

Saya mencari distribusi terbatas dari distribusi multinomial daripada hasil. Yaitu, distribusi berikut limn → ∞n- 12Xnlimn→∞n−12Xn\lim_{n\to \infty} n^{-\frac{1}{2}} \mathbf{X_n} Di mana XnXn\mathbf{X_n} adalah variabel acak nilai vektor dengan kepadatan fn( x )fn(x)f_n(\mathbf{x}) untuk...

10
Mengukur plot QQ

Plot qq dapat digunakan untuk memvisualisasikan seberapa mirip dua distribusi itu (misalnya memvisualisasikan kesamaan distribusi ke distribusi normal, tetapi juga untuk membandingkan dua distribusi data artibrary). Apakah ada statistik yang menghasilkan ukuran numerik yang lebih obyektif yang...

10
Omega kuadrat untuk mengukur efek dalam R?

Buku statistik yang saya baca merekomendasikan omega kuadrat untuk mengukur efek percobaan saya. Saya telah membuktikan menggunakan desain plot terpisah (campuran antara subyek dan desain antara subyek) bahwa faktor dalam subyek saya signifikan secara statistik dengan p <0,001 dan F =...

10
Perbandingan dua distribusi longitudinal

Saya memiliki hasil tes tes darah yang diberikan kepada 2.500 orang empat kali dalam interval enam bulan. Hasilnya terutama terdiri dari dua ukuran respon imun - satu di hadapan antigen tuberkulosis tertentu, satu di ketiadaan. Saat ini, setiap tes mengevaluasi positif atau negatif berdasarkan...

10
Perhitungan indeks musiman untuk musiman kompleks

Saya ingin meramalkan barang eceran (berdasarkan minggu) menggunakan pemulusan eksponensial. Saya terjebak sekarang dalam cara menghitung, menyimpan, dan menerapkan indeks sesonality. Masalahnya adalah bahwa semua contoh yang saya temukan berurusan dengan semacam musiman sederhana. Dalam kasus...

10
Bagaimana cara menangani pertanyaan survei dengan beberapa respons?

Saya memiliki dataset yang menanyakan kepada orang-orang apakah mereka pernah ke tempat tertentu (misalnya A, B, C, D), dan mereka dapat membuat lebih dari satu pilihan, kemudian spesimen diambil dari hidung mereka untuk melihat apakah mereka terinfeksi dengan beberapa penyakit. Saya perlu...