Statistik dan Big Data

10
Hutan acak vs Adaboost

Dalam bagian 7 dari makalah Hutan Acak (Breiman, 1999), penulis menyatakan dugaan berikut: "Adaboost is a Random Forest". Adakah yang membuktikan, atau membantah ini? Apa yang telah dilakukan untuk membuktikan atau menyangkal postingan ini tahun

10
Apakah median merupakan properti "metrik" atau "topologis"?

Saya minta maaf atas sedikit penyalahgunaan terminologi; Saya harap akan menjadi jelas apa yang saya maksud di bawah ini. Pertimbangkan variabel acak . Baik mean dan median dapat dikarakteristikkan dengan kriteria optimalitas: Mean adalah angka μ yang meminimalkan , dan median angka yang...

10
Cara menghindari log (0) istilah dalam regresi

Saya telah mengikuti vektor X dan Y sederhana: > X [1] 1.000 0.063 0.031 0.012 0.005 0.000 > Y [1] 1.000 1.000 1.000 0.961 0.884 0.000 > > plot(X,Y) Saya ingin melakukan regresi menggunakan log X. Untuk menghindari log (0), saya mencoba untuk memberi +1 atau +0.1 atau +0.00001...

10
Apa itu bucketization?

Saya sudah berkeliling untuk menemukan penjelasan yang jelas tentang "emberisasi" dalam pembelajaran mesin tanpa hasil. Apa yang saya pahami sejauh ini adalah bahwa bucketisasi mirip dengan kuantisasi dalam pemrosesan sinyal digital di mana serangkaian nilai kontinu diganti dengan satu nilai...