Statistik dan Big Data

50
Mengapa ANOVA setara dengan regresi linier?

Saya membaca bahwa ANOVA dan regresi linier adalah hal yang sama. Bagaimana bisa, mengingat bahwa output ANOVA adalah beberapa nilai dan beberapa p- nilai berdasarkan yang Anda simpulkan jika sampel berarti di sampel yang berbeda adalah sama atau berbeda.FFFppp Tetapi dengan asumsi cara tidak sama...

50
Apa intuisi di balik SVD?

Saya telah membaca tentang dekomposisi nilai singular (SVD). Di hampir semua buku teks disebutkan bahwa itu faktorisasi matriks menjadi tiga matriks dengan spesifikasi yang diberikan. Tapi apa intuisi di balik pemisahan matriks dalam bentuk seperti itu? PCA dan algoritma lain untuk pengurangan...

49
Bootstrap vs jackknife

Baik metode bootstrap dan jackknife dapat digunakan untuk memperkirakan bias dan kesalahan standar estimasi dan mekanisme kedua metode resampling tidak jauh berbeda: pengambilan sampel dengan penggantian vs tinggalkan satu pengamatan pada satu waktu. Namun, jackknife tidak sepopuler bootstrap dalam...

49
Apakah "peringkat rata-rata" Amazon menyesatkan?

Jika saya mengerti benar, peringkat buku pada skala 1-5 adalah skor Likert. Artinya, angka 3 bagi saya belum tentu menjadi angka 3 untuk orang lain. Ini adalah IMO skala ordinal. Seseorang seharusnya tidak benar-benar skala ordinal tetapi pasti dapat mengambil mode, median dan persentil. Jadi,...

49
Waktu komputasi hutan acak dalam R

Saya menggunakan paket pesta dalam R dengan 10.000 baris dan 34 fitur, dan beberapa fitur fitur memiliki lebih dari 300 level. Waktu komputasi terlalu lama. (Butuh 3 jam sejauh ini dan belum selesai.) Saya ingin tahu elemen apa yang berpengaruh besar pada waktu komputasi hutan acak. Apakah ada...

48
Apa blog visualisasi data favorit Anda?

Apa blog terbaik tentang visualisasi data? Saya membuat pertanyaan ini sebagai wiki komunitas karena sangat subyektif. Harap batasi setiap jawaban ke satu tautan. Harap perhatikan kriteria berikut untuk jawaban yang diajukan: [A] jawaban yang dapat diterima untuk pertanyaan seperti ini ......

48
Apa perbedaan antara NaN dan NA?

Saya ingin tahu mengapa beberapa bahasa seperti R memiliki NA dan NaN. Apa perbedaannya atau apakah keduanya sama? Apakah benar-benar perlu memiliki