Statistik dan Big Data

25
Bagaimana komponen utama teratas dapat mempertahankan daya prediksi pada variabel dependen (atau bahkan mengarah ke prediksi yang lebih baik)?

Misalkan Saya menjalankan regresi . Mengapa dengan memilih komponen prinsip k atas X , apakah model mempertahankan daya prediksi pada Y ?Y∼XY∼XY \sim XkkkXXXYYY Saya mengerti bahwa dari dimensi-reduksi / titik fitur-seleksi pandang, jika adalah vektor eigen dari kovarians matriks X dengan top k...

25
Mengapa varians sampel berubah jika pengamatan digandakan?

Varians dikatakan ukuran penyebaran. Jadi, saya berpikir bahwa varians 3,5sama dengan varians 3,3,5,5karena jumlahnya tersebar merata. Tapi ini tidak terjadi, varians dari 3,5adalah 2sedangkan varian 3,3,5,5adalah 1 1/3. Ini membingungkan saya, mengingat penjelasan bahwa varians seharusnya menjadi...

25
Bagaimana regresi kuantil "bekerja"?

Saya berharap mendapatkan penjelasan intuitif dan dapat diakses dari regresi kuantil. Katakanlah saya memiliki dataset sederhana hasil , dan prediktor .X 1 , X 2YYYX1, X2X1,X2X_1, X_2 Misalnya, jika saya menjalankan regresi kuantil pada 0,25, .5, .75, dan mendapatkan kembali .β0 , .25, β1 , .25....

25
Distribusi Jaynes

Dalam buku Jaynes "Probability Theory: The Logic of Science" , Jaynes memiliki bab (Bab 18) berjudul " Distribusi dan aturan suksesi" di mana ia memperkenalkan ide distribusi , yang mana bagian ini membantu menggambarkan:ApApA_pApApA_p [...] Untuk melihatnya, bayangkan efek mendapatkan informasi...

25
Memvisualisasikan banyak variabel dalam satu plot

Saya ingin menunjukkan bagaimana nilai-nilai variabel tertentu (~ 15) berubah seiring waktu, tetapi saya juga ingin menunjukkan bagaimana variabel berbeda satu sama lain di setiap tahun. Jadi saya membuat plot ini: Tetapi bahkan ketika mengubah skema warna atau menambahkan jenis garis / bentuk...