Saya baru-baru ini mulai bereksperimen dengan pemrosesan bahasa alami (NLP) menggunakan CoreNLP dari Stanford , dan saya bertanya-tanya apa saja cara standar untuk menyimpan data parsing NLP untuk sesuatu seperti aplikasi penambangan teks?
Salah satu cara yang saya pikir mungkin menarik adalah untuk menyimpan anak-anak sebagai daftar adjacency dan memanfaatkan kueri rekursif (Postgres mendukung ini dan saya merasa ini bekerja dengan sangat baik).
Tapi saya berasumsi mungkin ada banyak cara standar untuk melakukan ini tergantung pada jenis analisis apa yang sedang dilakukan yang telah diadopsi oleh orang yang bekerja di lapangan selama bertahun-tahun. Jadi apa strategi persistensi standar untuk data parsing NLP dan bagaimana mereka digunakan?
sumber