Di Ubuntu 12.10, jika saya mengetik
gnome-screenshot -a | tesseract output
mengembalikan:
** Message: Unable to use GNOME Shell's builtin screenshot interface, resorting to fallback X11.
Bagaimana saya bisa memilih teks dari layar dan mengubahnya menjadi teks (clipboard atau dokumen)?
Terima kasih!
gnome-screenshot -a
? Juga mengapa Anda menyalurkan output ke tesseract? Jika saya tidak salah, gnome-screenshot menyimpan gambar pada file, dan tidak "mencetak" itu ...auto-save-directory
? Dan apakah itu menjatuhkan sesuatu di sana? Tautan menarik: forums.debian.net/viewtopic.php?f=6&t=85683Jawaban:
Mungkin sudah ada beberapa alat yang melakukan itu, tetapi Anda juga dapat membuat skrip sederhana dengan beberapa alat tangkapan layar dan tesseract, saat Anda mencoba menggunakannya.
Ambil sebagai contoh skrip ini (di sistem saya saya menyimpannya sebagai
/usr/local/bin/screen_ts
)Dan dengan dukungan clipboard:
Ini digunakan
scrot
untuk mengambil layar,tesseract
untuk mengenali teks dancat
untuk menampilkan hasilnya. Versi clipboard juga digunakanxsel
untuk menyalurkan output ke clipboard.CATATAN :
scrot
,xsel
,imagemagick
dantesseract-ocr
tidak diinstal secara default, tetapi tersedia dari repositori default.Anda mungkin bisa mengganti
scrot
dengangnome-screenshot
, tetapi mungkin butuh banyak pekerjaan. Mengenai output, Anda dapat menggunakan apa pun yang dapat membaca file teks (buka dengan Editor Teks, tampilkan teks yang dikenali sebagai pemberitahuan, dll).Versi skrip GUI
Berikut ini adalah versi grafis sederhana dari skrip OCR termasuk dialog pemilihan bahasa:
Selain dependensi yang tercantum di atas, Anda perlu menginstal garpu Zenity YAD dari PPA webupd8 untuk membuat skrip berfungsi.
sumber
rm $SCR_IMG.png $SCR_IMG.txt
).scrot
dengan sendirinya tidak dapat menggunakan clipboard. Tetapi ada alat sepertixclip
atauxsel
yang dapat melakukan apa yang Anda butuhkan jika ingin menyalin / menempelkan teks.| clipboard
ke akhir baris terakhir naskah Salem.Tidak tahu apakah ada yang membutuhkan solusi saya. Inilah salah satu yang berjalan dengan wayland.
Ini menunjukkan pengenalan karakter dalam Editor Teks dan jika Anda menambahkan parameter "ya" Anda mendapat terjemahan dari alat trans goggle (koneksi Internet wajib) Sebelum Anda dapat menggunakannya instal tesseract-ocr imagemagick dan google-trans. Mulai skrip yaitu di gnome dengan Alt + F2 ketika Anda melihat teks yang ingin Anda kenali. Pindahkan kursor di sekitar teks. Itu dia. Script ini hanya diuji untuk gnome. Untuk window manager lain, sebaiknya mengakomodasi. Untuk menerjemahkan teks dalam bahasa lain, ganti ID bahasa di baris 25.
sumber
Saya baru saja melakukan blogging tentang cara menggunakan tangkapan layar di zaman modern. Meskipun saya menargetkan bahasa Mandarin tetapi layar dan kodenya dalam bahasa Inggris. OCR hanyalah salah satu fitur.
Fitur untuk OCR saya:
Buka di konsole + vimx ATAU gedit untuk mengedit lebih lanjut.
Untuk vimx + bahasa Inggris, aktifkan pemeriksaan ejaan.
Mendukung pemilihan bahasa dinamis tanpa kode keras.
Dialog progres saat mengonversi dan menjalankan yang lambat.
Kode fungsi:
Kode penelepon:
Gabungkan kode 2 ini dalam skrip shell tunggal untuk dijalankan.
Tangkapan layar 1:
Tangkapan layar 2:
sumber
Idenya adalah kapan saja file screenshot baru muncul di folder, jalankan tesseract OCR di atasnya dan buka di file editor.
Anda dapat meninggalkan skrip yang sedang berjalan ini di direktori output direktori keluaran screen shot favorit Anda
Anda akan membutuhkan ini untuk disimpan
sumber
Saya membuat program sumber terbuka dan gratis untuk tujuan ini:
https://danpla.github.io/dpscreenocr/
sumber