Statistik dan Big Data

31
Mengakomodir pandangan p-value yang mengakar

Terkadang dalam laporan saya menyertakan penafian tentang nilai-p dan statistik inferensial lainnya yang saya berikan. Saya mengatakan bahwa karena sampel tidak acak, maka statistik seperti itu tidak akan berlaku ketat. Kata-kata spesifik saya biasanya diberikan dalam catatan kaki: "Sementara,...

31
Visualisasi sejuta, edisi PCA

Apakah mungkin untuk memvisualisasikan output dari Analisis Komponen Utama dengan cara yang memberikan wawasan lebih dari sekadar tabel ringkasan? Apakah mungkin untuk melakukannya ketika jumlah pengamatan besar, katakan ~ 1e4? Dan mungkinkah melakukannya di R [lingkungan lain

31
Mengapa pemilihan variabel diperlukan?

Prosedur pemilihan variabel berbasis data umum (misalnya, maju, mundur, bertahap, semua himpunan bagian) cenderung menghasilkan model dengan sifat yang tidak diinginkan, termasuk: Koefisien yang bias jauh dari nol. Kesalahan standar yang terlalu kecil dan interval kepercayaan yang terlalu...