Statistik dan Big Data

38
Mengapa Pohon Keputusan tidak mahal secara komputasi?

Dalam Pengantar Pembelajaran Statistik dengan Aplikasi dalam R , penulis menulis bahwa pemasangan pohon keputusan sangat cepat, tetapi ini tidak masuk akal bagi saya. Algoritma harus melalui setiap fitur dan mempartisi dengan segala cara untuk menemukan pemisahan optimal. Untuk fitur numerik dengan...

37
Buku teks statistik Open Source?

Ada beberapa pertanyaan tentang buku teks statistik , seperti pertanyaan Buku teks statistik gratis . Namun, saya mencari buku teks yang Open Source, misalnya, memiliki lisensi Creative Commons . Alasannya adalah karena materi dalam domain lain, Anda masih ingin memasukkan beberapa teks tentang...

37
Analisis seri waktu validasi silang

Saya telah menggunakan paket caret dalam R untuk membangun model prediksi untuk klasifikasi dan regresi. Caret menyediakan antarmuka terpadu untuk menyetel model hiper-parameter dengan validasi silang atau strapping boot. Misalnya, jika Anda sedang membangun model 'tetangga terdekat' yang sederhana...

37
Apa sumber data ekonomi yang paling berguna?

Ketika melakukan penelitian di bidang Ekonomi, orang sering perlu memverifikasi kesimpulan teoritis tentang data nyata. Apa sumber data yang dapat diandalkan untuk digunakan dan dikutip? Saya terutama tertarik pada sumber-sumber yang menyediakan berbagai data statistik seperti PDB, populasi, IHK,...