Kode Saya:
import nltk.data
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
Pesan eror:
[ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py
Traceback (most recent call last):
File "mapper_local_v1.0.py", line 16, in <module>
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load
opened_resource = _open(resource_url)
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open
return find(path_, path + ['']).open()
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, in find
raise LookupError(resource_not_found)
LookupError:
Resource u'tokenizers/punkt/english.pickle' not found. Please
use the NLTK Downloader to obtain the resource:
>>>nltk.download()
Searched in:
- '/home/ec2-user/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- u''
Saya mencoba menjalankan program ini di mesin Unix:
Sesuai pesan kesalahan, saya masuk ke shell python dari mesin unix saya kemudian saya menggunakan perintah di bawah ini:
import nltk
nltk.download()
dan kemudian saya mendownload semua hal yang tersedia menggunakan opsi d-down loader dan l- list tetapi masalah tetap ada.
Saya mencoba yang terbaik untuk menemukan solusi di internet tetapi saya mendapatkan solusi yang sama dengan apa yang saya lakukan seperti yang saya sebutkan dalam langkah-langkah saya di atas.
Jawaban:
Untuk menambah jawaban alva , Anda hanya dapat mengunduh
punkt
korpus:Mendownload
all
kedengarannya berlebihan bagi saya. Kecuali itu yang Anda inginkan.sumber
Jika Anda hanya ingin mengunduh
punkt
model:Jika Anda tidak yakin sedang yang data / memodelkan Anda butuhkan, Anda dapat menginstal populer dataset, model dan taggers dari NLTK:
Dengan perintah di atas, tidak perlu menggunakan GUI untuk mengunduh kumpulan data.
sumber
Saya mendapat solusinya:
setelah NLTK Downloader dimulai
d) Unduh l) Daftar u) Perbarui c) Konfigurasi h) Bantuan q) Keluar
Pengunduh> d
Unduh paket mana (l = list; x = cancel)? Pengenal> punkt
sumber
Dari shell Anda dapat mengeksekusi:
Jika Anda ingin menginstal corpora / model NLTK yang populer:
Jika Anda ingin menginstal semua corpora / model NLTK:
Untuk mendaftar sumber daya yang telah Anda unduh:
sumber
Buka prompt Python dan jalankan pernyataan di atas.
Fungsi sent_tokenize menggunakan instance PunktSentenceTokenizer dari modul nltk.tokenize.punkt . Instance ini telah dilatih dan berfungsi dengan baik untuk banyak bahasa Eropa. Sehingga mengetahui tanda baca dan karakter apa yang menandai akhir kalimat dan awal kalimat baru.
sumber
Hal yang sama terjadi pada saya baru-baru ini, Anda hanya perlu mengunduh paket "punkt" dan itu akan berfungsi.
Ketika Anda menjalankan "list" (l) setelah "mendownload semua hal yang tersedia", apakah semuanya ditandai seperti baris berikut ?:
Jika Anda melihat baris ini dengan bintang, itu berarti Anda memilikinya, dan nltk harus dapat memuatnya.
sumber
Buka konsol python dengan mengetik
di terminal Anda. Kemudian, ketik 2 perintah berikut di shell python Anda untuk menginstal paket masing-masing:
Ini memecahkan masalah saya.
sumber
Masalah saya adalah saya menelepon
nltk.download('all')
sebagai pengguna root, tetapi proses yang akhirnya menggunakan nltk adalah pengguna lain yang tidak memiliki akses ke / root / nltk_data tempat konten diunduh.Jadi saya hanya menyalin semuanya secara rekursif dari lokasi unduhan ke salah satu jalur di mana NLTK ingin menemukannya seperti ini:
sumber
Jalankan kode berikut:
Setelah ini, pengunduh NLTK akan muncul.
sumber
Setelah menambahkan baris kode ini, masalah akan diperbaiki:
sumber
Saya mendapatkan kesalahan meskipun mengimpor yang berikut ini,
tapi untuk google colab ini menyelesaikan masalah saya.
sumber
Nltk.download () sederhana tidak akan menyelesaikan masalah ini. Saya mencoba yang di bawah ini dan itu berhasil untuk saya:
di folder nltk buat folder tokenizers dan salin folder punkt Anda ke folder tokenizers.
Ini akan berhasil.! struktur folder harus seperti yang ditunjukkan pada gambar
sumber
Anda perlu mengatur ulang folder Anda. Pindahkan
tokenizers
folder Anda ke dalamnltk_data
folder. Ini tidak berfungsi jika Anda memilikinltk_data
folder yang berisicorpora
folder yang berisitokenizers
foldersumber
Bagi saya tidak ada yang berhasil di atas, jadi saya hanya mengunduh semua file dengan tangan dari situs web http://www.nltk.org/nltk_data/ dan saya meletakkannya juga dengan tangan di file "tokenizers" di dalam "nltk_data "folder. Bukan solusi yang bagus tapi tetap solusi.
sumber
Saya menghadapi masalah yang sama. Setelah mengunduh semuanya, masih ada kesalahan 'punkt'. Saya mencari paket di mesin windows saya di C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers dan saya dapat melihat 'punkt.zip' ada di sana. Saya menyadari bahwa entah bagaimana zip belum diekstraksi ke C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers \ punk. Setelah saya mengekstrak zip, itu berfungsi seperti musik.
sumber
Pastikan Anda menggunakan
Jupyter
Notes dan di dalam notebook, lakukan hal berikut:Kemudian akan muncul satu jendela popup (menampilkan info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml ) Dari situ Anda harus mendownload semuanya.
Kemudian jalankan kembali kode Anda.
sumber
Bagi saya itu diselesaikan dengan menggunakan "nltk:"
http://www.nltk.org/howto/data.html
Gagal memuat english.pickle dengan nltk.data.load
sumber