Ilmu Data

18
NLP - mengapa "bukan" kata yang berhenti?

Saya mencoba untuk menghapus kata-kata berhenti sebelum melakukan pemodelan topik. Saya perhatikan bahwa beberapa kata negasi (tidak, tidak, tidak, tidak ada, dll.) Biasanya dianggap sebagai kata-kata berhenti. Misalnya, NLTK, spacy dan sklearn menyertakan "tidak" pada daftar kata stop mereka....

18
Ekstraksi fitur gambar dalam Python

Di kelas saya, saya harus membuat aplikasi menggunakan dua pengklasifikasi untuk memutuskan apakah suatu objek dalam gambar adalah contoh filum porifera (seasponge) atau objek lain. Namun, saya benar-benar tersesat ketika datang ke fitur teknik ekstraksi dalam python. Penasihat saya meyakinkan...

18
Apakah dimensi t-sne bermakna?

Apakah ada arti untuk dimensi embedding t-sne? Seperti halnya PCA, kami memiliki perasaan ini untuk memaksimalkan varians linear, tetapi untuk t-sne apakah ada intuisi selain hanya ruang yang kami tetapkan untuk pemetaan dan minimalisasi

17
Pengelompokan berdasarkan skor kesamaan

Asumsikan bahwa kita memiliki satu set elemen E dan kesamaan ( tidak jarak ) fungsi sim (ei, ej) antara dua elemen ei, ej ∈ E . Bagaimana kita (secara efisien) mengelompokkan elemen-elemen E , menggunakan sim ? k -berarti, misalnya, membutuhkan k yang diberikan , Canopy Clustering membutuhkan dua...

17
Deep Neural Network - Backpropogation dengan ReLU

Saya mengalami beberapa kesulitan dalam menurunkan propagasi kembali dengan ReLU, dan saya melakukan beberapa pekerjaan, tetapi saya tidak yakin apakah saya berada di jalur yang benar. Fungsi Biaya: 12(y−y^)212(y−y^)2\frac{1}{2}(y-\hat y)^2di manayyyadalah nilai riil, dan y adalah nilai prediksi....

17
Mendeteksi kucing secara visual melalui deteksi anomali

Saya memiliki proyek hobi yang saya renungkan sebagai komitmen untuk meningkatkan pengalaman belajar mesin saya yang sejauh ini terbatas. Saya telah mengambil dan menyelesaikan MOOC Coursera tentang topik tersebut. Pertanyaan saya berkaitan dengan kelayakan proyek. Tugasnya adalah sebagai...

17
Algoritma untuk pengelompokan teks

Saya memiliki masalah mengelompokkan kalimat dalam jumlah besar ke dalam kelompok dengan artinya. Ini mirip dengan masalah ketika Anda memiliki banyak kalimat dan ingin mengelompokkannya berdasarkan artinya. Algoritma apa yang disarankan untuk melakukan ini? Saya tidak tahu jumlah cluster di muka...

17
Apa arti notasi mAP @ [. 5: .95]?

Untuk deteksi, cara umum untuk menentukan apakah satu proposal objek benar adalah Persimpangan atas Union (IoU, IU). Ini mengambil himpunan dari objek piksel yang diusulkan dan set piksel objek benar dan menghitung:BSEBUAHSEBUAHABBB sayao U( A , B ) = A ∩ BA ∪