Statistik dan Big Data

16
Paket R untuk Hutan Acak Tertimbang? Opsi classwt?

Saya mencoba menggunakan Random Forest untuk memprediksi hasil dari set data yang sangat tidak seimbang (tingkat kelas minoritas hanya sekitar 1% atau bahkan kurang). Karena algoritma Acak Hutan tradisional meminimalkan tingkat kesalahan keseluruhan, daripada memberikan perhatian khusus pada...

16
Interpretasi interval kepercayaan

Catatan: permintaan maaf sebelumnya jika ini adalah duplikat, saya tidak menemukan q serupa dalam pencarian saya Katakanlah kita memiliki parameter true p. Interval kepercayaan C (X) adalah RV yang berisi p, katakanlah 95% dari waktu. Sekarang anggaplah kita mengamati X dan menghitung C (X)....

16
Kesalahpahaman nilai-P?

Jadi saya sudah banyak membaca tentang bagaimana menafsirkan nilai-P dengan benar, dan dari apa yang saya baca, nilai-p mengatakan TIDAK ADA tentang kemungkinan bahwa hipotesis nol benar atau salah. Namun, ketika membaca pernyataan berikut: Nilai p menunjukkan kemungkinan membuat kesalahan tipe...

16
Dua model tahap: Perbedaan antara model Heckman (untuk berurusan dengan pemilihan sampel) dan variabel Instrumental (untuk berurusan dengan endogenitas)

Saya mencoba mencari tahu perbedaan antara pemilihan sampel dan endogenitas dan pada gilirannya bagaimana model Heckman (untuk menangani pemilihan sampel) berbeda dari regresi variabel instrumental (untuk menangani endogenitas). Apakah benar untuk mengatakan bahwa pemilihan sampel adalah bentuk...

16
Linearitas varians

Saya pikir dua formula berikut ini benar: Var(aX)=a2Var(X)Var(aX)=a2Var(X) \mathrm{Var}(aX)=a^2 \mathrm{Var}(X) sedangkan a adalah bilangan konstan Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y) \mathrm{Var}(X + Y)=\mathrm{Var}(X)+\mathrm{Var}(Y) jikaXXX ,YYY adalah independen Namun, saya tidak...