Bagaimana cara mengkonversi file .pdf ke folder gambar?

16

Saya memiliki beberapa file .pdf yang ingin saya konversikan ke format bacaan .cbr atau .cbz yang saya sukai atau, jika ini tidak mungkin secara langsung, saya perlu mengekstrak semua halaman dari .pdf sebagai gambar dan kemudian mengompresnya menjadi format pilihan saya. Saya hanya dapat menyimpan halaman satu per satu dengan Document Viewer. Jelas, saya ingin melakukannya sedikit lebih cepat. Saya sudah mencoba pdfsam, puff shuffler, dan pdfmod semuanya tidak berhasil. Saya menggunakan Ubuntu 11.10.

Shawn
sumber

Jawaban:

14

Oke, saya melakukan penelitian lebih lanjut dan walaupun metode tohuwawohu berhasil, saya merasa lebih mudah menggunakan program yang disebut pdftoppm untuk mencapai apa yang ingin saya lakukan. Karena saya cukup awam ketika menggunakan aplikasi command line, saya akan melakukan yang terbaik untuk menjelaskan bagaimana saya membuat ini bekerja untuk saya.

  1. Arahkan ke folder yang berisi .pdf yang ingin Anda edit dan buka terminal di sana. Saya melakukan ini dengan menggunakan perintah sampel:

    cd ~/Documents/PDF
    
  2. Katakanlah file yang ingin saya edit disebut Sample.pdf Yang ingin saya lakukan adalah menggunakan pdftoppm untuk membuat file gambar dari setiap halaman .pdf. Beberapa format dapat dipilih (lihat tautan halaman manual di atas) tetapi saya lebih suka menggunakan .png. Perintah dasar terlihat seperti ini:

    pdftoppm -FORMAT FILENAME.pdf PREFIX
    

    atau dalam contoh di atas:

    pdftoppm -png Sample.pdf Sample
    

    Perintah ini membuat file gambar dari setiap halaman dalam folder yang sama dengan file .pdf asli dengan nama-nama seperti Sample-01.png, Sample-02.png dan sebagainya. Saya telah mencobanya dengan ekstensi .png dan .jpeg berhasil. .jpg rupanya tidak didukung.

  3. Lalu saya hanya menggunakan Archive Manager dengan memilih semua file gambar yang baru dibuat, mengklik kanan, dan memilih "Kompres" dari menu konteks. Saya kemudian memilih format arsip yang saya sukai (dalam hal ini .cbz atau Comic Book Zip) dan membuat arsip baru.

  4. Sekarang saya memiliki file .cbz baru yang mengkilap bernama Sample.cbz yang kemudian dapat saya lihat dengan pembaca Comix saya !

Semoga apa yang saya posting di atas cukup masuk akal bahwa orang lain dapat belajar darinya. Jika saya perlu mengubahnya dengan cara apa pun, silakan beri tahu saya.

Shawn
sumber
Sangat bagus! Tampaknya pdftoppmini sebenarnya lebih mudah digunakan daripada ImageMagick convert.
tohuwawohu
ya itu sangat membantu dan mudah. Saya hanya ingin tahu. dapat menambahkan awalan alfa. Seperti awalan-a, awalan-b, awalan-c, dengan cara ini
Pankaj Badukale
pdftoppmsangat lambat dan menggunakan semua RAM di komputer saya. pdfimages -jbekerja jauh lebih baik.
Eric Duminil
4

Saya tidak terlalu terbiasa dengan * .cbr / * .cbz, tetapi sepertinya Anda harus menggabungkan dua langkah:

  1. Konversi PDF ke Gambar
  2. Kompres mereka menjadi arsip ZIP / RAR.

Mengenai langkah 1, Anda bisa menggunakan ImageMagick 's convertperintah. Anda dapat memberi makan convertdengan PDf yang terdiri dari beberapa halaman, dan convertakan mengembalikan setiap halaman sebagai file grafik tunggal. Saya telah mengujinya dengan teks yang dipindai pada 400 dpi, dan perintah berikut menghasilkan JPGE tunggal yang bagus:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpeg

(kredit tentang -qualityopsi: entri forum ini )

Hasilnya, Anda dapatkan 000.jpeg, 001.jpegdan sebagainya. Cukup zip menjadi a.cbz file, dan Anda selesai.

Anda bahkan dapat menggabungkan kedua langkah dengan "menyatukan" mereka:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpg && zip -vm comic.cbz *.jpg

(pastikan tidak ada JPEG lain di direktori kerja Anda saat ini, karena menggunakan kode di atas, zip akan memindahkan semua JPEG ke file cbz)

tohuwawohu
sumber
4

Saya telah menulis skrip bash sederhana untuk tujuan ini, Anda perlu menginstal poppler, jadi:

sudo apt-get install poppler-utils #ubuntu
brew install poppler # mac

Berikut ini skrip bash (simpan sebagai convert_to_cbz.sh):

filename="${1%.*}"
echo "Converting $filename to cbz"
mkdir "./$filename"
pdftoppm -jpeg "$1" "./$filename/000"
zip -r9 "${filename}.cbz" "./$filename" 
rm -rf "./$filename"

Untuk menggunakan skrip bash:

chmod +x convert_to_cbz.sh
./convert_to_cbz.sh "Nintendo Official Magazine 066 (OldGameMags).pdf"

Semoga ini bermanfaat bagi seseorang!

Alasdair Morrison
sumber
Hebat, terima kasih. Saya harus sedikit mengubah skrip. pdftoppmmenggunakan semua RAM saya dan mematikan komputer saya. Mengganti baris ke-4 dengan pdfimages -j "$1" "./$filename/000" melakukan trik. Ini berfungsi dengan baik, cepat, sepertinya tidak ada kehilangan kualitas dan cbz sedikit lebih kecil dari pdf asli. pdfimagesjuga termasuk dalam poppler-utils.
Eric Duminil
3

Coba gunakan kaliber untuk secara langsung mengkonversi .pdf ke .cbr atau .cbz.

bntser
sumber
Terima kasih atas sarannya, tetapi bagi saya menggunakan Calibre sebagai solusi tidak akan berhasil. Saya menginstal program dan saya menyesal mengatakan bahwa itu menonjol seperti jempol yang sakit pada desktop saya! Juga, saya menemukan menggunakan perintah pdftoppm di bawah ini WAY lebih cepat daripada menginstal dan mengkonfigurasi Calibre sebelum mengkonversi.
Shawn
@ Shawn Ya, saya akan mengatakan bahwa Calibre jelek dan lambat, tetapi itu memang berhasil. Saya senang Anda menemukan solusi yang lebih baik, :)
bntser
1

Tampaknya cara termudah adalah menggunakan Acrobat Pro.

  1. Buka PDf di Acrobat Pro.
  2. Setelah file dibuka, buka FileExportImageJPEG , itu akan mengekspor setiap halaman sebagai JPG tunggal.
  3. Tempatkan semua JPG dalam folder
  4. Zip foldernya.
  5. Ubah ekstensi secara manual di akhir file zip dari .zip ke .cbz

Jika Anda lebih suka file CBR , rar folder alih-alih zip, lalu ubah ekstensi dari .rar ke .cbr .

Eric Vincent
sumber