Bisakah Anda merekomendasikan paket penambangan teks dalam R yang dapat digunakan terhadap volume data yang besar?
Kedua, apakah ada GUI yang tersedia untuk semua paket penambangan teks di R?
Ketiga, adakah program penambangan teks open source lain yang mudah dan intuitif untuk digunakan?
12
Jawaban:
Silakan lihat Tampilan Tugas CRAN pada Pemrosesan Bahasa Alami yang mencakup, antara lain, paket tm yang telah disebutkan oleh Josh.
sumber
Lihat paket tm dan presentasi ini oleh Stefan Theussl yang diberikan pada konferensi R / Keuangan 2010 .
sumber
Berikut adalah dua proyek terintegrasi lebih lanjut:
Keduanya adalah perangkat lunak sumber terbuka.
sumber
Tentu, RapidMiner dengan ekstensi penambangan teks.
Ada banyak video yang menunjukkan cara melakukannya.
sumber
GATE sangat komprehensif. Ini juga memungkinkan Anda untuk bekerja dengan berbagai bahasa dan memiliki editor ontologi.
sumber
Andrew McCallum (UMass) memiliki beberapa proyek perangkat lunak terkait NLP yang tersedia di halaman webnya . Ini semua di Jawa (saya pikir) dengan kode sumber yang tersedia.
sumber
Selain Tampilan Tugas CRAN pada Pemrosesan Bahasa Alami yang disebutkan oleh Dirk, ada paket quanteda dan paket NLP .
sumber