Statistik dan Big Data

32
ANOVA pada data binomial

Saya menganalisis kumpulan data eksperimental. Data terdiri dari vektor pasangan jenis pengobatan dan hasil binomial: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... Di kolom hasil, 1 menunjukkan keberhasilan dan 0 menunjukkan kegagalan. Saya ingin mencari tahu apakah perawatan secara signifikan...

32
Apa konsep statistik paling sulit untuk dipahami?

Ini adalah pertanyaan yang mirip dengan yang ada di sini , tetapi cukup berbeda menurut saya layak untuk ditanyakan. Saya pikir saya akan menjadi starter, apa yang saya pikir salah satu yang paling sulit untuk dipahami adalah. Milik saya adalah perbedaan antara probabilitas dan frekuensi . Yang...

32
Bagaimana R menangani nilai yang hilang dalam lm?

Saya ingin mundur vektor B terhadap masing-masing kolom dalam matriks A. Ini sepele jika tidak ada data yang hilang, tetapi jika matriks A berisi nilai yang hilang, maka regresi saya terhadap A dibatasi untuk menyertakan hanya baris di mana semua nilai ada ( perilaku default na.omit ). Ini...

32
Varians produk dari variabel dependen

Apa rumus untuk varian produk dari variabel dependen? Dalam kasus variabel independen, rumusnya sederhana: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} = {\rm var}(X){\rm var}(Y) +...

32
Mengapa R mengembalikan NA sebagai koefisien lm ()?

Saya menyesuaikan lm()model ke set data yang mencakup indikator untuk kuartal keuangan (Q1, Q2, Q3, menjadikan Q4 sebagai default). Menggunakan lm(Y~., data = data) Saya mendapatkan NAsebagai koefisien untuk Q3, dan peringatan bahwa satu variabel dikeluarkan karena singularitas. Apakah saya perlu...