Ilmu Data

11
Menggunakan Clustering dalam pemrosesan teks

Hai, ini adalah pertanyaan pertama saya di tumpukan Ilmu Data. Saya ingin membuat algoritma untuk klasifikasi teks. Misalkan saya punya satu set besar teks dan artikel. Mari kita katakan sekitar 5000 teks biasa. Saya pertama kali menggunakan fungsi sederhana untuk menentukan frekuensi keempat kata...

11
Konsekuensi dari Penskalaan Fitur

Saat ini saya menggunakan SVM dan meningkatkan fitur pelatihan saya ke kisaran [0,1]. Saya pertama kali cocok / mengubah set pelatihan saya dan kemudian menerapkan transformasi yang sama untuk set pengujian saya. Sebagai contoh: ### Configure transformation and apply to training set...

11
Bagaimana cara menggabungkan data bulanan, harian, dan mingguan?

Google Trends mengembalikan data mingguan sehingga saya harus menemukan cara untuk menggabungkannya dengan data harian / bulanan saya. Apa yang telah saya lakukan sejauh ini adalah memecah setiap seri menjadi data harian, sebagai contoh: dari: 2013-03-03 - 2013-03-09 37 untuk: 2013-03-03 37...

11
Intuisi untuk parameter regularisasi dalam SVM

Bagaimana memvariasikan parameter regularisasi dalam SVM mengubah batas keputusan untuk dataset yang tidak dapat dipisahkan? Jawaban visual dan / atau komentar tentang perilaku membatasi (untuk regularisasi besar dan kecil) akan sangat

11
Menggores web LinkedIn

Baru- baru ini saya menemukan paket R baru untuk terhubung ke API LinkedIn. Sayangnya API LinkedIn tampaknya cukup terbatas untuk memulainya; misalnya, Anda hanya bisa mendapatkan data dasar tentang perusahaan, dan ini terlepas dari data individu. Saya ingin mendapatkan data tentang semua karyawan...

11
Bagaimana word2vec dapat digunakan untuk mengidentifikasi kata-kata yang tidak terlihat dan menghubungkannya dengan data yang sudah terlatih

Saya sedang mengerjakan model gensim word2vec dan merasa sangat menarik. Saya tertarik menemukan bagaimana kata yang tidak diketahui / tidak terlihat ketika diperiksa dengan model akan bisa mendapatkan istilah yang sama dari model yang dilatih. Apakah ini mungkin? Bisakah word2vec di-tweak untuk...

11
menerapkan word2vec pada file teks kecil

Saya benar-benar baru di word2vec jadi tolong bawa. Saya memiliki satu set file teks yang masing-masing berisi satu set tweet, antara 1000-3000. Saya telah memilih kata kunci yang umum ("kw1") dan ingin mencari istilah yang relevan secara semantik untuk "kw1" menggunakan word2vec. Misalnya jika...

11
Bagaimana cara "niat recognisers" bekerja?

Amazon Alexa , Nuance's Mix dan Facebook's Wit.ai semuanya menggunakan sistem yang sama untuk menentukan cara mengubah perintah teks menjadi maksud - yaitu sesuatu yang akan dipahami komputer. Saya tidak yakin apa nama "resmi" untuk ini, tetapi saya menyebutnya "pengakuan niat". Pada dasarnya cara...