Statistik dan Big Data

14
Kapan seseorang ingin menggunakan AdaBoost?

Seperti yang saya pernah mendengar tentang classifier AdaBoost berulang kali disebutkan di tempat kerja, saya ingin mendapatkan perasaan yang lebih baik tentang cara kerjanya dan ketika seseorang mungkin ingin menggunakannya. Saya telah maju dan membaca sejumlah makalah dan tutorial tentang hal itu...

14
Penjelasan intuitif tentang stasioneritas

Saya bergulat dengan stasioner di kepala saya untuk sementara waktu ... Apakah ini yang Anda pikirkan? Setiap komentar atau pemikiran lebih lanjut akan dihargai. Proses stasioner adalah proses yang menghasilkan nilai deret waktu sehingga rata-rata distribusi dan varians tetap konstan....

14
Hosting data minat publik gratis? [Tutup]

Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 4 tahun yang lalu . Saya memiliki laporan suhu harian dan harian untuk...

14
Menghitung AUPR dalam R [ditutup]

Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 7 bulan lalu . Mudah untuk menemukan area penghitungan paket di bawah ROC,...

14
Mengapa ikatan begitu sulit dalam statistik nonparametrik?

Teks nonparametrik saya, Praktis Statistik Nonparametrik , sering memberikan rumus yang bersih untuk harapan, varian, statistik uji, dan sejenisnya, tetapi termasuk peringatan bahwa ini hanya berfungsi jika kita mengabaikan ikatan. Saat menghitung Statistik Mann-Whitney U, Anda disarankan untuk...

14
Metrik

Apakah ada yang menggunakan metrik atau L .5 untuk pengelompokan, bukan L 2 ? Aggarwal et al., Tentang perilaku mengejutkan metrik jarak dalam ruang dimensi tinggi mengatakan (pada 2001) ituL1L1L_1L.5L.5L_.5L2L2L_2 secara konsisten lebih disukai daripada metrik jarak Euclidean L 2 untuk...

14
Cara menyetel smoothing dalam model GAM mgcv

Saya mencoba mencari cara untuk mengontrol parameter smoothing dalam model mgcv: gam. Saya memiliki variabel binomial yang saya coba modelkan terutama sebagai fungsi koordinat x dan y pada grid tetap, ditambah beberapa variabel lain dengan pengaruh yang lebih kecil. Di masa lalu saya telah...

14
Contoh penggalian teks dengan R (paket tm)

Saya menghabiskan tiga hari mencoba-coba tmsetelah membaca kertas konsep oleh seorang teman di mana ia menjelajahi corpus teks dengan UCINET, menunjukkan awan teks, grafik jaringan dua mode dan Dekomposisi Nilai Tunggal (dengan grafik, menggunakan Stata). Saya berlari di bawah sejumlah besar...