Saya mengerjakan Aplikasi OCR di mana saya harus memilih opsi berdasarkan input teks pengguna.
Ex:
Available Options:
["python", "ruby", "java", "clojure", "haskell"]
Input: kava
Output: java
Input: ruby
Output: ruby
Input: clujuro
Output: clojure
etc..
aplikasi saya berbasis python, apakah sudah ada algoritma untuk menyelesaikan masalah ini.
python
algorithms
strings
Shiv Deepak
sumber
sumber
Jawaban:
Ini dilakukan oleh algoritme kategori " perkiraan string yang cocok ". Ukuran umum untuk membandingkan dua string disebut jarak Levenshtein . Ada implementasi python yang tersedia di sini .
Anda pada dasarnya membandingkan input dengan output yang mungkin dan memilih satu dengan jarak terkecil ke output yang diinginkan.
Artikel wikipedia juga menyebutkan berbagai algoritma lain yang dapat Anda coba seandainya Anda membutuhkan sesuatu yang lebih spesifik.
sumber
Anda bisa menggunakan google "maksud Anda?" API ...
http://pygoogle.sourceforge.net/dist/doc/public/google-module.html#doSpellingSuggestion
sumber