Pertanyaan yang diberi tag nltk

Natural Language Toolkit adalah pustaka Python untuk linguistik komputasi.

144
Gagal memuat english.pickle dengan nltk.data.load

Saat mencoba memuat punkttokenizer ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... a LookupErrordibesarkan: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle'...

137
n-gram dalam python, empat, lima, enam gram?

Saya mencari cara untuk membagi teks menjadi n-gram. Biasanya saya akan melakukan sesuatu seperti: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Saya sadar bahwa nltk hanya menawarkan bigrams dan...

110
Cara menghapus kata berhenti menggunakan nltk atau python

Jadi saya memiliki kumpulan data yang ingin saya hapus kata-kata henti dari penggunaan stopwords.words('english') Saya berjuang bagaimana menggunakan ini dalam kode saya untuk hanya mengambil kata-kata ini. Saya sudah memiliki daftar kata-kata dari kumpulan data ini, bagian yang saya perjuangkan...

101
masalah pip menginstal hampir semua perpustakaan

Saya mengalami kesulitan menggunakan pip untuk menginstal hampir semua hal. Saya baru mengenal pengkodean, jadi saya pikir mungkin ini adalah kesalahan yang telah saya lakukan dan telah memilih untuk keluar dari easy_install untuk menyelesaikan sebagian besar dari apa yang perlu saya selesaikan,...