Bagaimana saya bisa mengubah foto dokumen kertas menjadi dokumen yang dipindai?

44

Pemindai saya rusak! Saya memiliki kamera yang bagus jadi saya telah mengambil beberapa foto dari dokumen yang ingin saya pindai ... Namun mereka terlihat seperti foto kertas, bukan dokumen yang dipindai:

  • Gambar tidak rata
  • Pencahayaan tidak merata (bayangan saat halaman melengkung, dll.)
  • Teks jelas tidak diproses menjadi teks PDF yang dapat disalin.

Mereka tidak cocok untuk penggunaan profesional, tetapi mereka dekat.

Saya mencari beberapa hal (atau metode) yang dapat melakukan salah satu atau semua hal di atas sehingga saya dapat beralih dari sejumlah file JPG ke satu [opsional] beranotasi PDF keseluruhan, itu dalam format yang tepat (A4 khas).

Adakah saran (tidak mau keluar dan membeli pemindai baru)?

Oli
sumber
1
Di Android, aplikasi Google Drive dapat melakukan sedikit pemrosesan, dan memberi Anda PDF ukuran A4 dari serangkaian gambar (membuat "pemindaian" baru) - menerapkan B&W dan sedikit meluruskan (keduanya pada aplikasi, sementara membuat) di atasnya, dan sebagian besar terlihat pemindaian (kualitas rendah). OCR adalah masalah yang lebih sulit.
muru
Tidak tahu ada perangkat lunak Ubuntu tetapi saya membuang pemindai saya setelah mengetahui bahwa ada aplikasi pada ponsel yang kebanyakan melakukan hal yang sama. Anda mungkin ingin melihat aplikasi Genius Scan (untuk Android) atau Scannable (untuk iPhone). Kemudian oleskan pdfjoinuntuk menjahitnya bersama. Tidak ada OCR.
Jos
Alasan saya ingin melakukan ini melalui foto daripada aplikasi seluler adalah dSLR saya [secara harfiah] sekitar seribu kali lebih baik daripada kamera ponsel saya. Dan jika tidak ada yang melakukan ini dalam satu gerakan, saya benar-benar berpikir saya bisa menangani OCR sendiri. Ada banyak proyek open source yang melakukan pekerjaan dengan cukup baik.
Oli
Saya mungkin baru saja meresusitasi pemindai saya dengan selotip, roti panggang dan selai sehingga urgensi dimatikan tetapi saya pikir ini masih merupakan masalah yang menarik.
Oli
Oli , saya mencari beberapa contoh di Stackexchange seperti ini tex.stackexchange.com/questions/94523/simulate-a-canned-paper dan stackoverflow.com/questions/8955425/... tidak yakin apakah saya menjawab pertanyaan Anda dengan benar;)
JoKeR

Jawaban:

46

Ada beberapa cara untuk melakukannya. Meskipun semua cara saya yang sugge memiliki satu masalah, mereka tidak akan benar-benar meratakan gambar Anda. Gambaran yang kurang lebih bagus masih diperlukan.

Salah satu cara mudah adalah Anda mencoba perangkat lunak ScanTailor

sudo apt-get install scantailor 

Ini membawa Anda melalui 6 langkah untuk mengoptimalkan foto Anda. Pada langkah terakhir Anda dapat memilih opsi "Menyamakan pencahayaan" ini akan memberi Anda tampilan bersih yang bagus!


Secara pribadi saya biasanya hanya menggunakan GIMP . Tetapi Anda membutuhkan beberapa keterampilan dasar untuk mencapai tujuan Anda.

sudo apt-get install gimp 
  1. potong gambar dengan cara yang diinginkan
  2. gunakan opsi Colors-> Curvesuntuk memanipulasi keluaran warna dengan cara yang Anda inginkan ...

Sesuaikan Kurva Warna untuk mendapatkan hasil bersih yang bagus.


Program kecil yang bagus adalah gscan2pdf , di mana Anda juga dapat memuat foto dan mengekspornya dalam bentuk PDF. Bahkan ada tautan ke GIMP sehingga Anda dapat meningkatkan foto dengan langkah-langkah yang dijelaskan di atas .

sudo apt-get install gscan2pdf 
celaka
sumber
1
Belum pernah melihat ScanTailor sebelumnya. Tampaknya hampir sempurna kecuali bahwa saya tidak dapat menemukan cara menyimpannya sebagai sesuatu yang ingin saya simpan (misalnya PDF). Ada ide?
Oli
PS: selamat datang di Tanya Ubuntu dan Stack Exchange!
Oli
1
@Oli hasilnya disimpan di folder yang Anda pilih di awal. Seperti yang saya lihat sekarang ini menyimpannya sebagai tiff. Jadi, Anda ingin menjalankan convert file.tiff file.pdfdi konsol.
wittich
2
Oh ya, salahku. Saya menggunakan beberapa halaman jadi saya akan mengonversinya menjadi png dengan find -maxdepth 1 -name '*.tif' -exec convert {} {}.png \;dan kemudian bergabung dengan mereka pdfjoin --outfile output.pdf --a4paper --rotateoversize false *.png. Hanya berpikir keras ketika saya lupa bagaimana melakukan semua ini :) Terima kasih lagi.
Oli
2
ScanTailor adalah penemuan !!! Saya biasanya akan melakukan semua hal ini di Gimp atau aplikasi berpemilik seperti Gimp, tetapi pemindaian khusus hanya memiliki fitur yang saya butuhkan untuk mengubah gambar saya menjadi gambar yang dipindai, menghilangkan semua suara :) Jauh lebih mudah daripada semua kurva yang saya gunakan pindah di Gimp. Terima kasih banyak !!!
Kostyantyn
20

Untuk menghasilkan salinan yang dapat dicetak atau PDF dari foto kamera dari sebuah dokumen, kita harus mengonversi secara manual cukup banyak untuk menghasilkan gambar yang mirip dengan yang dihasilkan dari pemindai. Sebagian besar konversi ini dapat dilakukan dengan Gimp.

  1. Cobalah untuk membuat yang terbaik semampu Anda sumber gambar asli:

    • Pilih cahaya terang untuk mengurangi noise piksel, tetapi untuk menghindari refleksi, pendarahan, atau penyebaran cahaya yang tidak merata, jangan gunakan flash kecuali Anda memiliki peralatan flash studio.
    • Jika mungkin pilih untuk menyalakan sumber setidaknya dari dua sisi (atas-bawah atau kanan-kiri)
    • Ambil foto dari jarak yang lebih jauh menggunakan tele daripada lensa sudut lebar.
    • Gunakan tripod untuk menghindari guncangan artefak.
    • Arahkan kamera ortogonal ke permukaan sumber.
    • Sertakan beberapa ruang yang berbatasan dengan sumber asli.
  2. Pertimbangkan desaturasi ke skala abu - abu untuk kontras yang lebih baik dan penghapusan artefak piksel berwarna.

    masukkan deskripsi gambar di sini

  3. Sesuaikan kecerahan dan kontras untuk membuat latar belakang abu-abu mungkin putih, dan huruf hitam pekat.

    • Ini dapat dengan cepat dilakukan dengan alat Gimp Colors> Levels di mana kita dapat menyeret titik hitam (kiri) dan titik putih (kanan) atau memilih titik hitam / putih dengan pemilih warna.

    masukkan deskripsi gambar di sini

    • Bayangan di sudut yang tertekuk tidak boleh dihapus tanpa juga menghilangkan bagian teks (lihat 6.)
  4. Hapus distorsi bantal?

    Bergantung pada kualitas lensa foto kami dan tingkat zoom yang kami gunakan, kami mungkin memiliki beberapa artefak bantal yang mengarah ke pelengkungan batas luar dokumen. Ada beberapa plugin untuk menghapus artefak ini, tetapi kita mungkin menemukan lebih cepat untuk memilih level zoom dari kamera kita di mana mereka hanya minimal. Setelah memotong (5.) kami bahkan mungkin tidak melihatnya lagi. Jadi melepas artefak bantal mungkin hanya diperlukan jika sumber gambar kami memiliki banyak garis lurus di bagian luar.

  5. Putar dan potong atau perspektif mengubah gambar jika perlu.

    Tidak seperti pemindai, kamera kami mungkin tidak mendapatkan sumber secara paralel dengan batas gambar. Alat Gimp Rotate atau Perspective akan memberi kita umpan balik visual untuk dapat memutar atau menyesuaikan perspektif gambar sampai garis teks sejajar dengan halaman.

    masukkan deskripsi gambar di sini
    Alat Perspektif di sisi kanan

Sekarang kita dapat memilih sumber dokumen dengan alat pilih persegi panjang untuk memotong gambar di dalam dokumen.

  1. Hapus bayangan yang tidak diinginkan dari tekukan, lipatan, atau artefak vignetting dari lensa kamera.

    • Bayangan ini sulit untuk dihapus dan tidak ada plugin atau filter otomatis untuk membantu kami.
    • Secara teori kita bisa overlay gradien mengisi ke wilayah ini tetapi mungkin tidak mengarah pada hasil yang diharapkan, maka mungkin tidak sepadan dengan waktu yang kita butuhkan.
    • Metode tercepat karena itu adalah dengan hanya menggunakan alat penghapus untuk menghapus semua bayangan jelek di luar teks (yang harus kita simpan).

      masukkan deskripsi gambar di sini dihapus -> masukkan deskripsi gambar di sini

  2. Gambar skala?

    Tergantung pada resolusi kamera yang meningkatkan gambar ke ukuran gambar pemindai hanya akan meningkatkan ukuran file tetapi tidak akan bermanfaat pada kualitas gambar. Menurunkan skala akan menghapus detail. Oleh karena itu kita tidak boleh skala gambar tetapi menyesuaikan ukuran cetak dari dialog printer (atau di bawah dalam 8.).

  3. Hasilkan PDF

    Kita dapat mengimpor gambar yang sekarang dipulihkan secara manual dengan baik ke LibreOffice ( Sisipkan> Media ) ke

    • Tentukan dimensinya
    • Ekspor sebagai PDF
    • Cetak (bagi saya mencetak dari LibreOffice mengarah ke hasil yang diinginkan jauh lebih sering daripada yang lain).
Takkat
sumber
Terima kasih banyak untuk langkah-langkah terperinci. Mereka telah membantu saya memecahkan masalah lama mengkonversi foto menjadi dokumen yang dipindai. Saya benar-benar terkesan dengan kekuatan transformasi perspektif.
Chethan S.
Jawaban yang luar biasa! Alat perspektif pada awalnya cukup membingungkan bagi saya, jadi inilah panduan yang bagus. Saya menambahkan 4 garis panduan lalu memusatkan sudut-sudut gambar di sekitar menggunakan alat perspektif sampai gambar itu persegi dengan semua 4 pedoman.
Gabriel Staples
(24 jam kemudian). Ups! Saya lupa tautannya. Inilah panduan yang saya bicarakan: lifewire.com/… .
Gabriel Staples
1

Jika Anda sudah memiliki gambar dokumen, cukup unduh aplikasi CamScanner ke ponsel / tablet Anda. Ini akan memungkinkan Anda mengimpor gambar, kemudian akan melakukan pemotongan yang disarankan dan memungkinkan Anda untuk meratakan serta menyesuaikan warna / kontras dll. Hanya butuh satu menit.

Dan
sumber