Statistik dan Big Data

35
Kontradiksi signifikansi dalam regresi linier: uji-t signifikan untuk koefisien vs statistik F keseluruhan tidak signifikan

Saya menyesuaikan model regresi linier berganda antara 4 variabel kategori (dengan masing-masing 4 level) dan output numerik. Dataset saya memiliki 43 pengamatan. Regresi memberi saya nilai- ppp berikut dari uji- ttt untuk setiap koefisien kemiringan: .15,.67,.27,.02.15,.67,.27,.02.15, .67, .27,...

35
PCA dan split kereta / tes

Saya memiliki dataset yang memiliki beberapa set label biner. Untuk setiap set label, saya melatih classifier, mengevaluasinya dengan validasi silang. Saya ingin mengurangi dimensi menggunakan analisis komponen utama (PCA). Pertanyaanku adalah: Apakah mungkin untuk melakukan PCA satu kali untuk...

35
Apa itu kesalahan standar residual?

Ketika menjalankan model regresi berganda dalam R, salah satu outputnya adalah kesalahan standar residual 0,0589 pada 95,161 derajat kebebasan. Saya tahu bahwa 95,161 derajat kebebasan diberikan oleh perbedaan antara jumlah pengamatan dalam sampel saya dan jumlah variabel dalam model saya. Apa...

35
Bagaimana cara menyelesaikan paradoks Simpson?

Paradoks Simpson adalah teka-teki klasik yang dibahas dalam kursus statistik pengantar di seluruh dunia. Namun, kursus saya puas dengan hanya mencatat bahwa ada masalah dan tidak memberikan solusi. Saya ingin tahu bagaimana menyelesaikan paradoks. Artinya, ketika dihadapkan dengan paradoks Simpson,...

35
Apakah semua metode simulasi semacam Monte Carlo?

Apakah ada metode simulasi yang bukan Monte Carlo? Semua metode simulasi melibatkan penggantian angka acak ke dalam fungsi untuk menemukan rentang nilai untuk fungsi tersebut. Jadi, apakah semua metode simulasi pada dasarnya adalah metode Monte