Saya telah menginstal python-nltk di Ubuntu Server 12.04 menggunakan apt-get.
Tetapi ketika saya mencoba mengunduh corpus, saya mendapatkan kesalahan berikut:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data] Required
False
Apakah saya kehilangan beberapa konfigurasi atau paket tambahan?
wget https://github.com/nltk/nltk/archive/develop.zip; unzip develop.zip; cd nltk-develop; python setup.py install
. Tetapi masalah telah diangkat di github.com/nltk/nltk/issues/747Jawaban:
The
DEFAULT_URL
digunakan dalamdownloader.py
dari Ubuntu versi dikemas masih menggunakan:Tetapi server data saat ini adalah:
Tentu saja Anda dapat menginstal dari sumber atau ... memodifikasi versi yang sudah diinstal untuk mengarahkan ke server baru seperti ini:
Anda kemudian dapat menginstal corpus "coklat":
sumber
Dimungkinkan untuk memperbaiki ini tanpa mengubah kode sumber. Buat pengunduh khusus dengan python:
maka Anda membuka dialog GUI:
Periksa Anda memiliki akses tulis ke direktori unduhan dan unduh apa yang Anda butuhkan.
sumber
Yang ini memperbarui nltk dan kemudian
nltk.download()
berfungsi kembali.sumber