Statistik dan Big Data

11
Panah variabel yang mendasarinya dalam PCA biplot di R

Dengan risiko membuat pertanyaan khusus perangkat lunak, dan dengan alasan di mana-mana dan keistimewaannya, saya ingin bertanya tentang fungsi biplot()dalam R, dan, lebih khusus, tentang perhitungan dan perencanaan default, panah merah yang dilapiskan, sesuai ke variabel yang

11
Pro dan kontra dari bootstrap

Saya baru saja belajar tentang konsep bootstrap, dan sebuah pertanyaan naif muncul di benak: Jika kita selalu dapat menghasilkan banyak sampel bootstrap dari data kita, mengapa repot-repot mendapatkan lebih banyak data "nyata" sama sekali? Saya pikir saya punya penjelasan, tolong beri tahu saya...

11
RandomForest dan bobot kelas

Pertanyaan dalam satu kalimat: Apakah ada yang tahu cara menentukan bobot kelas yang baik untuk hutan acak? Penjelasan: Saya bermain-main dengan dataset yang tidak seimbang. Saya ingin menggunakan Rpaket randomForestuntuk melatih model pada dataset yang sangat miring dengan hanya sedikit contoh...

11
Informasi Reksa sebagai probabilitas

Dapatkah informasi timbal balik melalui entropi bersama: 0≤I(X,Y)H(X,Y)≤10≤I(X,Y)H(X,Y)≤1 0 \leq \frac{I(X,Y)}{H(X,Y)} \leq 1 didefinisikan sebagai: "Peluang menyampaikan informasi dari X ke Y"? Saya minta maaf karena begitu naif, tetapi saya belum pernah mempelajari teori informasi, dan saya...