Di mana saya dapat mengunduh basis data kamus bahasa Inggris dalam format teks? [Tutup]

127

Saya perlu membaca file teks untuk sebuah kata dan mengembalikan maknanya. Format file lain juga akan berfungsi.

Abhi
sumber
Saya telah menulis clawler web untuk semua kamus online terkenal (Oxford, Longman, Cambridge, Webster, dan Collins) yang dapat Anda gunakan untuk membuat datset Anda. github.com/kiasar/Dictionary_crawler
Peyman

Jawaban:

62

The Gutenberg Project host Webster Unabridged English Dictionary plus banyak karya sastra domain publik lainnya. Sebenarnya sepertinya mereka memiliki beberapa versi kamus yang dihosting dengan hak cipta dari tahun yang berbeda. Yang saya tautkan memiliki hak cipta 2009. Anda mungkin ingin melihat-lihat situs dan menyelidiki berbagai versi kamus Webster.

Asaf
sumber
1
'09 membersihkan transkrip versi 1913, tampaknya OCR tidak sepenuhnya bersih. Ada total 15 versi di situs ini.
DragonLord
57

user1247808 memiliki tautan yang bagus dengan: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Jika itu tidak cukup kata untuk Anda:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (url yang diperbarui dari saran Michael Kropat)

Meskipun nama file itu berubah, Anda pasti ingin mencari yang terbaru ... yang ternyata hanya berupa file teks besar (sangat besar).

http://dumps.wikimedia.org/enwiktionary/

Orwellophile
sumber
terima kasih .. untuk tautan ini
AndyBoy
Anda selalu dapat mengunduh wiktionary terbaru dari dumps.wikimedia.org/enwiktionary/latest/…
Michael Kropat
androidtech / wordnet20 dalam format SQL bukan txt.
DragonLord
1
Harap dicatat: Sintaks di wordnet20 memiliki TYPE = * yang sudah tidak digunakan lagi dalam file .sql. Jalankan sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqluntuk mengganti sintaks yang sudah usang sebelum menjalankannya terhadap versi 5.0+ dari MySQL
Serguei Fedorov
tidak ada file txt sederhana yang mengandung semua kata bahasa Inggris?
Nadav B
27

Saya tidak tahu apakah sudah terlambat, tapi saya pikir itu akan membantu orang lain.

Saya sangat menginginkan yang sama ... akhirnya menemukannya.

Mungkin ini tidak sempurna, tetapi bagi saya itu cukup (untuk aplikasi kamus kecil saya).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Ini bukan file dump, tetapi file skrip MYSQL .sql

Kata-katanya ada di tabel WN_SYNSET dan glosarium / makna dalam tabel WN_GLOSS

pengguna1247808
sumber
4
Lisensi apa ini?
Cole Johnson
2
Saya tidak yakin juga, tetapi di androidtech.com/html/downloads.php adaHere are some files related to natural language and chatterbot projects that we are making available to the public
Betlista
7
Pengguna MySQL: buat tabel pernyataan menggunakan opsi TYPE sekarang dihapus. Jalankan ini pada file sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqluntuk membuatnya berfungsi di MySQL terbaru
anthonygore
15

Periksa apakah sumber daya gratis ini sesuai dengan kebutuhan Anda -

mvark
sumber
8
FOLDOC (Kamus Komputasi Online Gratis) tampaknya hanya berupa kamus istilah / nama komputasi. Mungkin bermanfaat untuk sebagian orang, tetapi ini bukan kamus tujuan umum yang dapat Anda gunakan untuk mencari kata-kata paling banyak.
Lèse majesté
2
Tautan halaman ObjectGraph juga mati. Versi yang dapat diunduh secara resmi ada di sini .
Lèse majesté
@ Lèsemajesté tautan Anda juga sudah mati sekarang
yukashima huksay