Statistik dan Big Data

30
Memvisualisasikan persimpangan banyak set

Apakah ada model visualisasi yang bagus untuk menunjukkan persimpangan tumpang tindih banyak set? Saya sedang memikirkan sesuatu seperti diagram Venn, tetapi entah bagaimana itu dapat memberikan lebih banyak jumlah set yang lebih besar seperti 10 atau lebih. Wikipedia memang menunjukkan beberapa...

30
Apa arti kedalaman interaksi dalam GBM?

Saya punya pertanyaan tentang parameter kedalaman interaksi dalam gbm di R. Ini mungkin pertanyaan noob, yang saya minta maaf, tetapi bagaimana parameternya, yang saya yakini menunjukkan jumlah terminal terminal dalam sebuah pohon, pada dasarnya menunjukkan X-way interaksi di antara para prediktor?...

30
Strategi untuk mengajarkan distribusi sampling

Versi tl; Strategi sukses apa yang Anda pakai untuk mengajarkan distribusi sampling (dari mean sampel, misalnya) di tingkat sarjana pengantar? Latar belakang Pada bulan September saya akan mengajar kursus statistik pengantar untuk ilmu sosial tahun kedua (terutama ilmu politik dan sosiologi)...

30
Teknik pembelajaran mesin untuk string parsing?

Saya memiliki banyak string alamat: 1600 Pennsylvania Ave, Washington, DC 20500 USA Saya ingin mengurai mereka menjadi komponen-komponen mereka: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA Tetapi tentu saja datanya kotor: itu berasal dari banyak...

30
Apa perbedaan antara estimator dan statistik?

Saya belajar bahwa statistik adalah atribut yang dapat Anda peroleh dari sampel. Mengambil banyak sampel dengan ukuran yang sama, menghitung atribut ini untuk semuanya dan memplot pdf, kami mendapatkan distribusi atribut yang sesuai atau distribusi statistik yang sesuai. Saya juga mendengar bahwa...