Apa cara yang baik untuk menerapkan "prediksi kata berikutnya"? Misalnya, pengguna mengetik "Saya" dan sistem menyarankan "a" dan "tidak" (atau mungkin orang lain) sebagai kata berikutnya. Saya mengetahui metode yang menggunakan Rantai Markov dan beberapa teks pelatihan (jelas) untuk mencapai atau kurang ini. Tetapi saya membaca di suatu tempat bahwa metode ini sangat membatasi dan berlaku untuk kasus yang sangat sederhana.
Saya mengerti dasar-dasar jaringan saraf dan algoritma genetika (walaupun belum pernah menggunakannya dalam proyek yang serius) dan mungkin mereka bisa membantu. Saya ingin tahu apakah ada algoritme yang, mengingat teks pelatihan yang sesuai (misalnya, artikel surat kabar, dan pengetikan pengguna sendiri) dapat menghasilkan saran yang cukup sesuai untuk kata berikutnya. Jika tidak (tautan ke) algoritma, metode umum tingkat tinggi untuk menyerang masalah ini dipersilakan.
n
yang menghasilkan hasil yang bagus? Itu tidak selalu harus menjadi kata ketiga yang diprediksi, Anda tahun
hasil yang lebih besar menghasilkan daftar yang lebih panjang yang akan memberi Anda prediksi yang lebih tepat tetapi juga lebih mahal untuk dicari. Jadi ini merupakan pertukaran antara waktu presisi dan komputasi.Sepertinya domain masalah adalah subset dari pencarian string. Dengan memperluas kata-kata untuk memasukkan spasi putih, pencocokan string fuzzy dapat diterapkan di sini.
Anda mungkin ingin mempertimbangkan / mengizinkan semua input pengguna sebagai satu kata selama pelatihan selain kamus Anda. Ini memungkinkan Anda untuk menyarankan kata berikutnya tetapi juga menyarankan secara otomatis melengkapi kata atau frasa.
Berikut ini tautan ke kompilasi algoritma pencarian string fuzzy
http://ntz-develop.blogspot.com/2011/03/fuzzy-string-search.html
sumber
Anda mencari model bahasa (statistik) .
sumber