Pertanyaan yang diberi tag r

R adalah bahasa pemrograman open source dan lingkungan perangkat lunak bebas untuk komputasi statistik, bioinformatika, dan grafik.

101
Python vs R untuk pembelajaran mesin

Saya baru mulai mengembangkan aplikasi pembelajaran mesin untuk tujuan akademik. Saat ini saya menggunakan R dan melatih diri saya di dalamnya. Namun, di banyak tempat, saya telah melihat orang menggunakan Python . Apa yang digunakan orang di dunia akademis dan industri, dan apa

56
Kapan Model Underfitted?

Logika sering menyatakan bahwa dengan underfitting model, kapasitasnya untuk menggeneralisasi meningkat. Yang mengatakan, jelas di beberapa titik model underfitting menyebabkan model menjadi lebih buruk terlepas dari kompleksitas data. Bagaimana Anda tahu kapan model Anda telah mencapai...

53
RNN vs CNN di tingkat tinggi

Saya sudah memikirkan Recurrent Neural Networks (RNN) dan varietas mereka dan Convolutional Neural Networks (CNN) dan varietas mereka. Apakah kedua poin ini adil untuk dikatakan: Gunakan CNN untuk memecah komponen (seperti gambar) menjadi subkomponen (seperti objek dalam gambar, seperti garis...

48
Apakah bahasa R cocok untuk Big Data

R memiliki banyak perpustakaan yang ditujukan untuk Analisis Data (misalnya JAGS, BUGS, ARULES dll.), Dan disebutkan dalam buku teks populer seperti: J.Krusche, Melakukan Analisis Data Bayesian; B.Lantz, "Pembelajaran Mesin dengan R". Saya telah melihat pedoman 5TB untuk dataset yang dianggap...

37
Apakah para ilmuwan data menggunakan Excel?

Saya akan menganggap diri saya sebagai ilmuwan data pekerja harian. Seperti kebanyakan (saya pikir), saya membuat bagan pertama saya dan melakukan agregasi pertama saya di sekolah menengah dan perguruan tinggi, menggunakan Excel. Ketika saya melewati masa kuliah, sekolah pascasarjana dan ~ 7 tahun...

34
Proses terorganisir untuk membersihkan data

Dari sedikit berkecimpung dengan ilmu data menggunakan R, saya menyadari bahwa membersihkan data yang buruk adalah bagian yang sangat penting dalam mempersiapkan data untuk analisis. Apakah ada praktik atau proses terbaik untuk membersihkan data sebelum memprosesnya? Jika demikian, apakah ada...

29
Mengapa xgboost jauh lebih cepat daripada sklearn GradientBoostingClassifier?

Saya mencoba untuk melatih model peningkatan gradien lebih dari 50k contoh dengan 100 fitur numerik. XGBClassifiermenangani 500 pohon dalam waktu 43 detik pada mesin saya, sementara GradientBoostingClassifierhanya menangani 10 pohon (!) dalam 1 menit dan 2 detik :( Saya tidak repot-repot mencoba...

27
Mengurangi parameter XGBoost

XGBoost telah melakukan pekerjaan dengan baik, ketika berurusan dengan variabel dependen kategoris dan kontinu. Tapi, bagaimana cara memilih parameter yang dioptimalkan untuk masalah XGBoost? Ini adalah bagaimana saya menerapkan parameter untuk masalah Kaggle baru-baru ini: param <- list(...

24
Ada konsol R Online?

Saya mencari konsol online untuk bahasa R. Seperti saya menulis kode dan server harus mengeksekusi dan memberi saya output. Mirip dengan situs web

24
Gambar VM untuk proyek ilmu data

Karena ada banyak alat yang tersedia untuk tugas-tugas ilmu data, dan rumit untuk menginstal semuanya dan membangun sistem yang sempurna. Apakah ada gambar Linux / Mac OS dengan Python, R dan alat sains data open-source lainnya diinstal dan tersedia untuk digunakan orang sekarang juga? Ubuntu atau...