File teks kamus [ditutup]

222

Saya menulis sebuah program yang membutuhkan BANYAK kata-kata dari bahasa Inggris. Saya mencoba mencari file kamus yang memiliki banyak kata. Adakah yang tahu sumber yang bagus? Saya mencoba banyak sumber tetapi mereka tampaknya tidak memilikinya.

SuperString
sumber
3
@DWright Saya tidak menghapusnya, saya menutupnya karena tidak sesuai dengan harapan Stack Overflow saat ini. Secara eksplisit meminta rekomendasi, tautan yang tidak sesuai topik.
Taryn
Cukup benar, saya lupa bahwa On Hold pergi ke Closed, bukan dihapus.
DWright
Jadi, @bluefeet, maaf atas komentar 'protes' saya yang salah informasi, tindakan Anda benar dan tidak mengurangi nilai.
DWright
15
Mengapa meminta maaf? Jelas itu memiliki nilai bagi komunitas SO. "Harapan saat ini" dari SO jelas meleset dari sasaran.
Andrew

Jawaban:

224

Bagaimana dengan /usr/share/dict/wordssistem Unix apa pun? Berapa banyak kata yang kita bicarakan? Suka OED-Tidak Dinamai?

Robert
sumber
20
terima kasih! 200000+ kata, sangat dihargai! cat /usr/share/dict/words > words.txtsemua hal!
jokoon
7
Jika Anda kehilangan file ini, Anda dapat menginstalnya di Debian / Ubuntu dengan mengetiksudo apt-get install wbritish
airstrike
17
Apakah seseorang secara kebetulan mengetahui tempat di mana ini dapat diunduh untuk sistem non-Unix?
Tom
2
@ Tom Ya, www.FreeBSD.org (instal FreeBSD di suatu tempat dan booming, Anda memilikinya). Kalau tidak, saya pikir daftar ini mirip: raw.githubusercontent.com/eneko/data-repository/master/data/… .
Greg Schmit
2
Jika Anda tidak tahu: Ini akan bekerja pada macOS juga :)
lewis
44

Untuk file .txt kamus bahasa Inggris, Anda dapat menggunakan Kamus Khusus .

Anda juga dapat membuat daftar aspell atau daftar kata dengan pengaturan sendiri.

Anda juga dapat melihat di http://wordlist.sourceforge.net/

Hanya kata bahasa Inggris: http://www.math.sjsu.edu/~foster/dictionary.txt

Sujith PS
sumber
Meskipun tautan ini dapat menjawab pertanyaan, lebih baik untuk memasukkan bagian-bagian penting dari jawaban di sini dan memberikan tautan untuk referensi. Jawaban hanya tautan dapat menjadi tidak valid jika halaman tertaut berubah.
DeanOC
21
@DeanOC: Saya pikir cukup jelas bahwa "bagian penting" dari kamus akan menjadi keseluruhan kamus. Itu tidak praktis untuk ditempelkan di sini. Ini juga cukup jelas apa penggunaannya: untuk mengambil kata-kata dari itu. Jadi ini bukan hanya tautan saja. Ini adalah jawaban rekomendasi yang sah untuk pertanyaan yang seharusnya (dan sekarang) ditutup.
Nathan Tuggy
@NathanTuggy Jawaban ini muncul dalam antrian LQP, dan saya percaya bahwa itu sesuai dengan definisi jawaban hanya tautan. Sebagai pengguna rep <3K, suara saya untuk dihapus tidak melakukan apa pun selain membantu membawanya ke perhatian orang yang bisa.
DeanOC
1
@DeanOC: Saya tahu itu muncul di LQP. Saya menekan Tampak OK, untuk alasan yang diberikan: pada dasarnya, bahwa "hanya tautan" jauh lebih halus daripada "memiliki tautan tetapi tidak ada kode atau kutipan? BURN DENGAN KEBAKARAN". Perhatikan bahwa pilihan Penghapusan Rekomendasi yang cukup oleh bahkan 2k pengguna akan menghapus posting. (Secara pribadi saya bertanggung jawab untuk memberi tip pada sejumlah pos.)
Nathan Tuggy
@NathanTuggy Anda secara alami bebas memilih sesuai keinginan Anda. Saya memilih untuk menghapus karena saya tidak melihat nilai dalam jawaban ini jika tautannya menjadi basi.
DeanOC
35

http://www.math.sjsu.edu/~foster/dictionary.txt

350.000 kata

Sangat terlambat, tetapi mungkin bermanfaat bagi orang lain.

Rajendra Uppal
sumber
24
Melihat beberapa yang pertama, banyak yang bukan kata-kata bahasa Inggris biasa.
tripleee
8
ini tidak ada gunanya karena itu kehilangan banyak kata-kata sederhana seperti dosa, di, ...
FernandoZ
7
Ya, dan memiliki kata-kata seperti "wwwwwww". Bukan sebuah kata.
Jared Forsyth
1
Hati-hati, tautan ini membuat Firefox saya mogok karena mencoba memuat seluruh file ahahahaha
Andrew
@Andrew tidak mogok di Chrome 50.
Bogdan M.
11

Ada juga WordNet . Format file datanya didokumentasikan dengan baik.
Saya menggunakannya untuk membangun perpustakaan kamus yang dapat disematkan untuk pengembang iOS ( www.lexicontext.com ) dan juga di salah satu aplikasi saya.

Ori
sumber
2
Jackpot. Jika ada yang mencari kata-kata yang dipetakan ke bagian pidato mereka, cukup unduh paket WordNet utama.
Andrew
10

@ Pencari-masa depan: Anda dapat menggunakan aspell untuk melakukan pemeriksaan kamus, ia memiliki binding dalam ruby ​​dan python. Itu akan membuat pekerjaan Anda lebih sederhana.

Khaja Minhajuddin
sumber