Statistik dan Big Data

8
Penjelasan satu kalimat dari AIC untuk jenis non-teknis

Saya perlu penjelasan satu kalimat tentang penggunaan AIC dalam pembuatan model. Sejauh ini saya telah "Sederhananya, AIC adalah ukuran relatif dari jumlah variasi yang diamati dicatat oleh model yang berbeda dan memungkinkan koreksi untuk kompleksitas model." Setiap saran sangat...

8
Bayesian menyimpulkan sejumlah variabel acak bernilai nyata

Misalkan , , ..., menjadi iid RV dengan rentang tetapi distribusinya tidak diketahui. (Saya setuju dengan anggapan bahwa distribusi ini kontinu, dll., Jika perlu.)X1X1X_1X2X2X_2XnXnX_n[0,1][0,1][0,1] Tentukan .Sn=X1+⋯+XnSn=X1+⋯+XnS_n = X_1 + \cdots + X_n Saya diberikan , dan bertanya: Apa yang...

8
Tarif tidak ada dan imputasi berganda

Apakah ada batas yang paling tidak dapat diterima saat menggunakan multiple imputation (MI)? Sebagai contoh, bisakah saya menggunakan MI jika nilai yang hilang dalam suatu variabel adalah 20% dari kasus sementara dan variabel lain memiliki nilai yang hilang tetapi tidak sampai tingkat yang...

8
Menafsirkan koefisien untuk regresi Poisson

Saya tidak mengerti bagaimana menafsirkan koefisien dari regresi Poisson relatif terhadap koefisien dari regresi OLS. Misalkan saya memiliki data deret waktu, variabel sisi kiri saya adalah jumlah permainan yang dimenangkan per tahun, dan variabel sisi kanan utama saya adalah nilai NASDAQ. Jika...

8
Bagaimana nilai dikonversi menjadi nilai p?

Saya baru mengenal statistik dan sedang mempelajari matematika di balik pengujian split (A / B dan multivarian). Saya telah belajar bagaimana menghitung dengan data uji yang diberikan, dan saya mengerti bagaimana menerjemahkan ini ke dalam probabilitas melalui tabel, tapi saya ingin dapat...

8
Klasifikasi dasar untuk meningkatkan

Algoritma pendongkrak , seperti AdaBoost , menggabungkan beberapa pengklasifikasi 'lemah' untuk membentuk satu pengklasifikasi yang lebih kuat. Meskipun secara teori, peningkatan harus dimungkinkan dengan pengklasifikasi dasar, dalam praktiknya tampaknya pengklasifikasi berbasis pohon adalah yang...

8
Bootstrap vs integrasi numerik

Pemahaman saya tentang pendekatan bootstrap didasarkan pada kerangka kerja Wasserman (hampir kata demi kata): Membiarkan Tn=g(X1,...,Xn)Tn=g(X1,...,Xn)T_n = g(X_1, ..., X_n) menjadi statistik (XiXiX_i adalah sampel awal yang diambil dari distribusi FFF). Misalkan kita ingin