Ekstrak teks OCR dari Evernote

13

Evernote melakukan OCR pada gambar yang Anda simpan. Apakah ada cara untuk mendapatkan teks lengkap yang setara dengan gambar di Evernote, atau apakah OCR hanya untuk pencarian?

Leigh Riffel
sumber

Jawaban:

15

Evernote API memiliki fungsi untuk mendapatkan teks dan persegi panjang di mana teks ini ada di dalam gambar. Lihat http://evernote.com/about/developer/api/evernote-api.htm , lihat "Format XML Indeks Pengenalan Evernote" dan fungsinya untuk mengambilnya. Masalahnya adalah bahwa mereka tidak melakukan OCR tradisional ... algoritma OCR mereka dapat menghasilkan kata-kata yang berbeda untuk "kata" tunggal pada gambar. Semua yang mereka gunakan untuk pencarian, jadi ini baik untuk mereka, tetapi tidak baik untuk menggunakannya sebagai mesin pengenalan. (Meskipun mereka memberi Anda bobot untuk setiap alternatif kata, jadi mungkin Anda bisa menggunakannya)

Peter Štibraný
sumber
11

Juga, Evernote tampaknya tidak memutuskan gambar tertentu setara dengan satu kata - misalnya, Evernote tidak menentukan bahwa gambar tertentu adalah "petunjuk" dan bukan "karena". Sebaliknya, ini akan melacak keduanya, dan pencarian untuk keduanya akan menghasilkan gambar yang sama. Oleh karena itu, tidak ada cara untuk mendapatkan teks lengkap yang setara karena Evernote tidak memutuskan apa sebenarnya teks itu, hanya apa yang bisa dilakukan.

Mike Dunham
sumber
5

evernote membayar jumlah yang layak kepada pencipta barang-barang atau ATAU membayar jumlah yang layak untuk menyatukan sesuatu. jadi, saya benar-benar ragu bahwa mereka akan membiarkan Anda mendapatkan teks yang diekstrak (+ memposisikan pada gambar).

(bisa menjadi model bisnis, untuk memindai gambar orang lain dan memberikan ocr yang baik :))

jadi, jawabannya adalah: tidak.

akira
sumber
3
Ini tidak benar. Ada API untuk mendapatkan informasi ini dengan tepat. Lihat jawaban saya.
Peter Štibraný
2

Saya tidak yakin berapa banyak kecanggihan yang Anda butuhkan, tetapi karena saya juga menggunakan Adobe Acrobat, saya cukup klik kanan pada lampiran Evernote saya untuk membuka dengan Acrobat.

Kemudian dari dalam Acrobat saya pilih "Document | OCR text recognition", lalu simpan dokumen sebagai teks biasa.

Ini berfungsi baik bagi saya karena saya hanya perlu konversi OCR sesekali.

Bruce Kessel
sumber
1

Jika Anda bisa mendapatkan semua gambar dari Evernote, Anda bisa melakukan OCR dengan Google Documents.

Anda dapat mengunggah folder gambar ke Google Documents dan mengonversinya ke Dokumen, yang akan berisi gambar dan teks OCR.

Anda kemudian dapat mengunduh semua dokumen ini sebagai teks biasa, yang akan menghapus gambarnya.

Jika Anda memberi nama semua gambar Evernote dengan hash (mis. md5), Akan mudah untuk menautkan file teks biasa yang diunduh dari Google Documents dengan gambar asli.

Max Masnick
sumber
0

Saya menggunakan Windows dan menggunakan Adobe Acrobat Pro dan Word jadi saya melakukan hal berikut:

  1. jika file tidak disimpan sebagai JPG kemudian klik ikon bola mata di sudut kiri atas gambar di Evernote untuk membukanya di Photo Viewer dan klik File> "Make a Copy" untuk menyimpan sebagai JPG
  2. browse ke file gambar di Explorer
  3. klik kanan di atasnya dan pilih Convert to Adobe PDF (file akan terbuka di Acrobat)
  4. klik File> Save As dan pilih Rich Text Format dari dropdown "Save as type" untuk menyimpan sebagai file teks kaya (perlu waktu sebentar untuk memproses file)
  5. browse ke file RTF di Explorer dan klik dua kali untuk membuka di Word
  6. edit seperlunya
Pete Nikolai
sumber
Tampaknya ini merupakan saran tentang cara mengekstrak teks dari file gambar yang diberikan, bukan gambar di Evernote. Bisakah Anda mengklarifikasi bagaimana ini menjawab pertanyaan asli, dan tidak dengan cara yang sebelumnya dan jawaban yang diterima tidak?
music2myear