Statistik dan Big Data

20
Statistik dasar untuk juri

Saya telah dipanggil untuk tugas juri. Saya sadar akan relevansi statistik dengan beberapa uji coba juri. Sebagai contoh, konsep "tingkat dasar" dan penerapannya pada perhitungan probabilitas terkadang - mungkin selalu - relevan. Apa topik statistik yang mungkin dipelajari oleh seseorang dalam...

20
Mengapa repot dengan perkiraan peringkat rendah?

Jika Anda memiliki matriks dengan kolom n rows dan m, Anda dapat menggunakan SVD atau metode lain untuk menghitung perkiraan peringkat rendah dari matriks yang diberikan. Namun, perkiraan peringkat rendah masih akan memiliki kolom n rows dan m. Bagaimana perkiraan peringkat rendah berguna untuk...

20
Mengapa pemangkasan tidak diperlukan untuk pohon hutan acak?

Breiman mengatakan bahwa pohon-pohon ditanam tanpa pemangkasan. Mengapa? Maksud saya mengatakan bahwa harus ada alasan kuat mengapa pohon-pohon di hutan acak tidak dipangkas. Di sisi lain itu dianggap sangat penting untuk memangkas pohon keputusan tunggal untuk menghindari pas. Apakah ada bacaan...

20
Uji-berpasangan versus tidak berpasangan

Misalkan saya punya 20 tikus. Saya memasangkan tikus dalam beberapa cara, sehingga saya mendapatkan 10 pasang. Untuk tujuan pertanyaan ini, itu bisa menjadi pasangan acak, ATAU itu bisa menjadi pasangan yang masuk akal, seperti mencoba untuk memasangkan tikus dari sampah yang sama, dari jenis...

20
Tes untuk pemisahan linear

Apakah ada cara untuk menguji keterpisahan linear dari dataset dua kelas dalam dimensi tinggi? Vektor fitur saya panjangnya 40. Saya tahu saya selalu dapat menjalankan percobaan regresi logistik dan menentukan hitrate vs false alarm rate untuk menyimpulkan apakah kedua kelas terpisah secara linear...