Ilmu Data

10
Kualifikasi untuk Program PhD

Yann LeCun menyebutkan dalam AMA- nya bahwa ia menganggap memiliki gelar PhD sangat penting untuk mendapatkan pekerjaan di perusahaan papan atas. Saya memiliki master dalam statistik dan sarjana saya di bidang ekonomi dan matematika terapan, tetapi saya sekarang melihat ke dalam program ML PhD....

10
Debugging Neural Networks

Saya telah membangun jaringan saraf tiruan dalam python menggunakan fungsi optimisasi scipy.optimize.minimize (Conjugate gradient). Saya telah menerapkan pemeriksaan gradien, mengecek semuanya dll dan saya cukup yakin itu berfungsi dengan benar. Saya telah menjalankannya beberapa kali dan...

10
Bagaimana cara men-debug analisis data?

Saya telah menemukan masalah berikut, yang saya rekomendasikan agak khas. Saya punya beberapa data besar, katakanlah, beberapa juta baris. Saya menjalankan beberapa analisis non-sepele, misalnya query SQL yang terdiri dari beberapa sub-query. Saya mendapatkan beberapa hasil, dengan menyatakan,...

10
Bahasa terbaik untuk komputasi ilmiah [ditutup]

Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Sepertinya sebagian...

10
Mempelajari regresi ordinal dalam R?

Saya sedang mengerjakan sebuah proyek dan membutuhkan sumber daya untuk mempercepat saya. Dataset adalah sekitar 35.000 pengamatan pada 30 atau lebih variabel. Sekitar setengah variabel adalah kategori dengan beberapa memiliki banyak nilai yang berbeda, yaitu jika Anda membagi variabel kategori...

10
Analisis jaringan dataset klasik

Ada beberapa dataset klasik untuk tugas klasifikasi / regresi pembelajaran mesin. Yang paling populer adalah: Set Data Bunga Iris ; Set Data Titanic ; Mobil Tren Motor ; dll. Tetapi apakah ada yang tahu dataset serupa untuk analisis jaringan / teori grafik? Lebih konkret - Saya mencari dataset...

10
Menangani set fitur yang terus meningkat

Saya sedang mengerjakan sistem deteksi penipuan. Di bidang ini, penipuan baru muncul secara teratur, sehingga fitur baru harus ditambahkan ke model secara berkelanjutan. Saya bertanya-tanya apa cara terbaik untuk menanganinya (dari perspektif proses pengembangan)? Hanya menambahkan fitur baru ke...

10
Peramalan pasar valuta asing dengan jaringan saraf

Saya ingin menggunakan JST untuk mengotomatisasi mata uang perdagangan, lebih disukai USD / EUR atau USD / GBP. Saya tahu ini sulit dan mungkin tidak langsung. Saya sudah membaca beberapa makalah dan melakukan beberapa percobaan tetapi tidak berhasil. Saya ingin mendapatkan saran dari AHLI untuk...

10
Prediksi dengan fitur non-atom

Saya ingin menggunakan data non-atom, sebagai fitur untuk prediksi. Misalkan saya punya Meja dengan fitur-fitur ini: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 ] - Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ] -...

10
Data multi-kelas miring

Saya memiliki dataset yang berisi ~ 100.000 sampel dari 50 kelas. Saya telah menggunakan SVM dengan kernel RBF untuk melatih dan memprediksi data baru. Masalahnya adalah dataset cenderung condong ke kelas yang berbeda. Misalnya, Kelas 1 - 30 (masing-masing 3%), Kelas 31 - 45 (~ masing-masing...

10
Data Perdagangan NASDAQ

Saya mencoba mencari data stok untuk dipraktikkan, apakah ada sumber daya yang bagus untuk ini? Saya menemukan ini: ftp://emi.nasdaq.com/ITCH/ tetapi hanya memiliki tahun berjalan. Saya sudah memiliki cara untuk menguraikan protokol, tetapi ingin memiliki lebih banyak data untuk dibandingkan....