Memindai banyak halaman langsung ke PDF

36

Apakah ada beberapa program yang mudah digunakan di Ubuntu yang dapat memindai banyak halaman langsung ke file PDF?

pupeno
sumber
Hanya ingin tahu, apakah ada kualifikasi khusus yang diperlukan untuk pemindai / printer yang ingin saya gunakan di Ubuntu?
JFW
@JFW, berikut adalah daftar perangkat yang didukung untuk XSane, back-end yang digunakan oleh kebanyakan pemindai Ubuntu. Printer / pemindai / mesin fotokopi HP sepertinya pilihan yang bagus dan andal, jika Anda melihatnya.
poolie

Jawaban:

38

Gagasan memiliki utilitas pemindaian sederhana berada di belakang pengembangan, well, Simple Scan - alat pemindaian yang terinstal secara default dari 10,04 aktif (Aplikasi ‣ Grafik Scan Pemindaian Sederhana). teks alternatif

Cukup memindai halaman sebanyak yang Anda inginkan dan pilih format file PDF saat menyimpan.

Program lain yang sedikit kurang sederhana yang menawarkan fitur-fitur tambahan seperti pengenalan teks adalah gscan2pdf , juga di repositori. teks alternatif

Marcel Stimberg
sumber
3
+1 untuk Pemindaian Sederhana - sangat mudah dan sederhana, tetapi juga sangat kuat - sangat cocok untuk pekerjaan yang Anda sebutkan.
8128
6

"Mudah digunakan" ada di mata pengguna, tetapi xsanemenyediakan fungsionalitas ini. Pilih multipage di mana dikatakan viewer (atau tekan CTRL-M), dan seharusnya tidak terlalu sulit untuk mencari tahu dari sana.

Karl Bielefeldt
sumber
1
Secara pribadi saya melihat xsane jauh dari mudah digunakan ...
8128
Saya telah menggunakan xsane selama ini. Tidak pernah terpikir oleh saya bahwa mungkin ada alat yang lebih baik.
Amanda
3

Saya menggunakan xsanesampai saya melihat pertanyaan ini dan menganggap antarmuka yang istimewa untuk sedikitnya, tetapi efektif.

Setelah melihat pertanyaan ini, saya mencari dan menemukan gscan2pdf tinggal di repositori Ubuntu Lucid / Maverick. Ini menggunakan mesin pemindaian (libsane) yang sama tetapi UI jauh lebih Gnome-ish. Untuk waktu yang baik, cobalah:

sudo apt-get install gscan2pdf
msw
sumber
3

Ubah nama file dari myfile.jpg ke myfile.pdf pada dialog simpan Simple Scan.

Diuji pada Ubuntu 14.04, Simple Scan 3.12.1.

Ini berfungsi meskipun jenis file drop-down tidak menunjukkan "PDF", hanya "Gambar". Saya menganggap ini sebagai bug UI.

Fitur ini didokumentasikan pada Help > Contents:

Dari kotak dialog "Simpan Sebagai", pilih salah satu jenis file yang didukung, atau cukup ganti ekstensi di bidang "Nama".

Dikatakan bahwa format berikut ini didukung:

  • PDF
  • JPEG
  • PNG
  • BERTENGKAR

Fakta menarik: jika Anda mengubah jenis pemindaian (dropdown selain "Pindai") menjadi "Teks", jenis file default menjadi PDF.

Ciro Santilli 新疆 改造 中心 法轮功 六四 事件
sumber
1

Memindai halaman dari pemindai USB. Gunakan tesseract untuk OCR ke dalam PDF. Gabungkan banyak halaman menjadi satu PDF. Penggunaan: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}
Morten
sumber
itu adalah metode yang sangat Linuxoidal
r
1

Bagi Anda yang ingin menggunakan XSANE. Ini sangat kuat, dan intuitif setelah Anda membaca panduan pengaturan yang ditautkan dari Help> XSane Doc di program - untuk mengetahui seberapa banyak yang dapat Anda lakukan dengannya. Ada baiknya juga memeriksa backend SANE Anda berfungsi dengan baik (tidak terlalu spesifik Arch): https://wiki.archlinux.org/index.php/SANE

Jika Anda ingin memindai dokumen secara otomatis dari pengumpan, dan bertanya-tanya apakah XSane akan tahu kapan harus berhenti (dan tidak berhenti terlalu dini), cukup masukkan angka di kiri atas (ikon jumlah pemindaian) yang lebih besar daripada jumlah halaman yang sesuai. di pengumpan Anda. Yaitu jika feeder Anda dapat mengambil 10 halaman, lalu masukkan 15 (untuk memperhitungkan variasi ketebalan). Jika Anda memiliki pemindai dupleks, gandakan nomor ini.

Ketika feeder habis, Anda akan mendapatkan kotak dialog dengan segitiga peringatan hijau yang mengatakan "" Halaman yang dipindai: 0 ". Ini hanya berarti bahwa feeder kosong dan Anda dapat menutup dialog. Jika Anda memilih" viewer "atau" save " "di kanan atas XSane, maka semua file akan berada di sana - ingatlah untuk menyimpannya dari pemirsa. Sekarang Anda dapat menekan pindai lagi untuk melanjutkan di mana Anda tinggalkan, dengan angka-angka yang bertambah dari titik yang sama atau Anda dapat mulai proyek baru. Tidak akan ada halaman kosong yang ditambahkan. Jika Anda memilih "Multipage", dialog proyek akan menunjukkan semua pemindaian yang telah selesai dan Anda dapat mengklik untuk menyimpan sebagai PDF multi-halaman atau TIFF atau PostScript.

HTH,

DC

user901387
sumber