Bagaimana cara mengekstrak rentang halaman / bagian dari PDF?

423

Apakah Anda tahu cara mengekstrak bagian dari dokumen PDF dan menyimpannya sebagai PDF? Pada OS X itu benar-benar sepele dengan menggunakan Preview. Saya mencoba editor PDF dan program lain tetapi tidak berhasil.

Saya ingin sebuah program di mana saya memilih bagian yang saya inginkan dan kemudian menyimpannya sebagai pdf dengan perintah sederhana seperti CMD+ Npada OS X. Saya ingin bagian yang diekstraksi disimpan dalam format PDF dan bukan jpeg dll.

pengguna72469
sumber
Apakah Anda mencoba ImageMagick?
Martin Schröder
3
Itu untuk bitmap saya butuh sesuatu yang disimpan sebagai PDF!
user72469
3
pdfshufflerdalam repo.
Marc
2
pdfshufflertidak berfungsi lagi di Ubuntu 14.04+. Anda selalu dapat menggunakan dialog cetak atau alternatif berbasis terminal sepertipdfseparate
Rho
@Rho Versi yang diinstal langsung melalui apt-getmasih berfungsi dengan baik untuk saya dalam 16,04. Mungkin mereka memperbaiki bug, jika ada?
xji

Jawaban:

476

pdftkadalah alat multi-platform yang berguna untuk pekerjaan itu ( homepage pdftk ).

pdftk full-pdf.pdf cat 12-15 output outfile_p12-15.pdf

Anda meneruskan nama file pdf utama, lalu Anda katakan hanya menyertakan halaman-halaman tertentu (12-15 dalam contoh ini) dan mengeluarkannya ke file baru.

Martin H
sumber
6
Jika saya ingin mengekstrak halaman 1-10, 15, dan 17, bagaimana saya menulis perintah?
Patrick Li
31
@ Patrickrickipdftk A=in.pdf cat A1-10 A15 A17 output out.pdf
m8mble
9
Catatan yang pdftktidak tersedia di Ubuntu 18.04. (lihat askubuntu.com/questions/1028522/… )
alkamid
6
@alkamid itu: sudo snap install pdftk
Qubix
12
Meskipun pdftktentu merupakan alat yang dapat melakukan pekerjaan itu, saya akan merekomendasikan menentangnya. Ini bukan perangkat lunak bebas, tetapi sepotong shareware yang kikuk. Juga membutuhkan JVM. Alat yang lebih masuk akal adalah qpdf, seperti yang disarankan dalam jawaban lain .
leftaroundabout
246

sangat sederhana, gunakan pembaca PDF default:

cetak sebagai file. hanya itu saja! menu cetak

kemudian

pengaturan PDF baru

Abdennour TOUMI
sumber
12
flippin brilliant
andybleaden
17
Menghasilkan hasil bencana dengan file beamer, peta, dan dokumen lain yang tidak sesuai dengan format halaman printer.
Luís de Sousa
11
Ini dapat menghasilkan file dengan ukuran yang jauh lebih besar dari dokumen aslinya.
dat
7
jadi itu tidak "mengekstrak" rentang halaman. Ini menciptakan pdf baru dari yang lama, seolah-olah Anda menggunakan pasangan printer / pemindai definisi tinggi.
sylvainulg
6
Bagus untuk kasus-kasus sederhana, tetapi hasil yang tidak diinginkan dalam dokumen dengan menyoroti komentar: sorotan menjadi 100% opacity dan memblokir teks.
loved.by.Yesus
79

Rentang halaman - Skrip Nautilus


Gambaran

Saya membuat skrip yang sedikit lebih maju berdasarkan pada tutorial @ThiagoPonte yang ditautkan. Fitur utamanya adalah

  • bahwa itu berbasis GUI,
  • kompatibel dengan spasi dalam nama file,
  • dan berdasarkan tiga backend berbeda yang mampu mempertahankan semua atribut dari file asli

Tangkapan layar

masukkan deskripsi gambar di sini

Kode

#!/bin/bash
#
# TITLE:        PDFextract
#
# AUTHOR:       (c) 2013-2015 Glutanimate (https://github.com/Glutanimate)
#
# VERSION:      0.2
#
# LICENSE:      GNU GPL v3 (http://www.gnu.org/licenses/gpl.html)
# 
# OVERVIEW:     PDFextract is a simple PDF extraction script based on Ghostscript/qpdf/cpdf.
#               It provides a simple way to extract a page range from a PDF document and is meant
#               to be used as a file manager script/addon (e.g. Nautilus script).
#
# FEATURES:     - simple GUI based on YAD, an advanced Zenity fork.
#               - preserves _all_ attributes of your original PDF file and does not compress 
#                 embedded images further than they are.      
#               - can choose from three different backends: ghostscript, qpdf, cpdf
#
# DEPENDENCIES: ghostscript/qpdf/cpdf poppler-utils yad libnotify-bin
#                         
#               You need to install at least one of the three backends supported by this script.
#
#               - ghostscript, qpdf, poppler-utils, and libnotify-bin are available via 
#                 the standard Ubuntu repositories
#               - cpdf is a commercial CLI PDF toolkit that is free for personal use.
#                 It can be downloaded here: https://github.com/coherentgraphics/cpdf-binaries
#               - yad can be installed from the webupd8 PPA with the following command:
#                 sudo add-apt-repository ppa:webupd8team/y-ppa-manager && apt-get update && apt-get install yad
#
# NOTES:        Here is a quick comparison of the advantages and disadvantages of each backend:
#
#                               speed     metadata preservation     content preservation        license
#               ghostscript:     --               ++                         ++               open-source
#               cpdf:             -               ++                         ++               proprietary
#               qpdf:            ++                +                         ++               open-source
#
#               Results might vary depending on the document and the version of the tool in question.
#
# INSTALLATION: https://askubuntu.com/a/236415
#
# This script was inspired by Kurt Pfeifle's PDF extraction script 
# (http://www.linuxjournal.com/content/tech-tip-extract-pages-pdf)
#
# Originally posted on askubuntu
# (https://askubuntu.com/a/282453)

# Variables

DOCUMENT="$1"
BACKENDSELECTION="^qpdf!ghostscript!cpdf"

# Functions

check_input(){
  if [[ -z "$1" ]]; then
    notify "Error: No input file selected."
    exit 1
  elif [[ ! "$(file -ib "$1")" == *application/pdf* ]]; then
    notify "Error: Not a valid PDF file."
    exit 1
  fi
}

check_deps () {
  for i in "$@"; do
    type "$i" > /dev/null 2>&1 
    if [[ "$?" != "0" ]]; then
      MissingDeps+="$i"
    fi
  done
}

ghostscriptextract(){
  gs -dFirstPage="$STARTPAGE "-dLastPage="$STOPPAGE" -sOutputFile="$OUTFILE" -dSAFER -dNOPAUSE -dBATCH -dPDFSETTING=/default -sDEVICE=pdfwrite -dCompressFonts=true -c \
  ".setpdfwrite << /EncodeColorImages true /DownsampleMonoImages false /SubsetFonts true /ASCII85EncodePages false /DefaultRenderingIntent /Default /ColorConversionStrategy \
  /LeaveColorUnchanged /MonoImageDownsampleThreshold 1.5 /ColorACSImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /GrayACSImageDict \
  << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /PreserveOverprintSettings false /MonoImageResolution 300 /MonoImageFilter /FlateEncode \
  /GrayImageResolution 300 /LockDistillerParams false /EncodeGrayImages true /MaxSubsetPCT 100 /GrayImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor \
  0.4 /Blend 1 >> /ColorImageFilter /FlateEncode /EmbedAllFonts true /UCRandBGInfo /Remove /AutoRotatePages /PageByPage /ColorImageResolution 300 /ColorImageDict << \
  /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /CompatibilityLevel 1.7 /EncodeMonoImages true /GrayImageDownsampleThreshold 1.5 \
  /AutoFilterGrayImages false /GrayImageFilter /FlateEncode /DownsampleGrayImages false /AutoFilterColorImages false /DownsampleColorImages false /CompressPages true \
  /ColorImageDownsampleThreshold 1.5 /PreserveHalftoneInfo false >> setdistillerparams" -f "$DOCUMENT"
}

cpdfextract(){
  cpdf "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -o "$OUTFILE"
}

qpdfextract(){
  qpdf --linearize "$DOCUMENT" --pages "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -- "$OUTFILE"
  echo "$OUTFILE"
  return 0 # even benign qpdf warnings produce error codes, so we suppress them
}

notify(){
  echo "$1"
  notify-send -i application-pdf "PDFextract" "$1"
}

dialog_warning(){
  echo "$1"
  yad --center --image dialog-warning \
  --title "PDFExtract Warning" \
  --text "$1" \
  --button="Try again:0" \
  --button="Exit:1"

  [[ "$?" != "0" ]] && exit 0
}

dialog_settings(){
  PAGECOUNT=$(pdfinfo "$DOCUMENT" | grep Pages | sed 's/[^0-9]*//') #determine page count

  SETTINGS=($(\
      yad --form --width 300 --center \
          --window-icon application-pdf --image application-pdf \
          --separator=" " --title="PDFextract"\
          --text "Please choose the page range and backend"\
          --field="Start:NUM" 1[!1..$PAGECOUNT[!1]] --field="End:NUM" $PAGECOUNT[!1..$PAGECOUNT[!1]] \
          --field="Backend":CB "$BACKENDSELECTION" \
          --button="gtk-ok:0" --button="gtk-cancel:1"\
      ))

  SETTINGSRET="$?"

  [[ "$SETTINGSRET" != "0" ]] && exit 1

  STARTPAGE=$(printf %.0f ${SETTINGS[0]}) #round numbers and store array in variables
  STOPPAGE=$(printf %.0f ${SETTINGS[1]})
  BACKEND="${SETTINGS[2]}"
  EXTRACTOR="${BACKEND}extract"

  check_deps "$BACKEND"

  if [[ -n "$MissingDeps" ]]; then
    dialog_warning "Error, missing dependency: $MissingDeps"
    unset MissingDeps
    dialog_settings
    return
  fi

  if [[ "$STARTPAGE" -gt "$STOPPAGE" ]]; then 
    dialog_warning "<b>   Start page higher than stop page.   </b>"
    dialog_settings
    return
  fi

  OUTFILE="${DOCUMENT%.pdf} (p${STARTPAGE}-p${STOPPAGE}).pdf"
}

extract_pages(){
  $EXTRACTOR
  EXTRACTORRET="$?"
  if [[ "$EXTRACTORRET" = "0" ]]; then
    notify "Pages $STARTPAGE to $STOPPAGE succesfully extracted."
  else
    notify "There has been an error. Please check the CLI output."
  fi
}


# Main

check_input "$1"
dialog_settings
extract_pages

Instalasi

Silakan ikuti instruksi instalasi generik untuk skrip Nautilus . Pastikan untuk membaca header skrip dengan hati-hati karena ini akan membantu untuk memperjelas pemasangan dan penggunaan skrip.


Halaman sebagian - PDF Shuffler


Gambaran

PDF-Shuffler adalah aplikasi python-gtk kecil, yang membantu pengguna untuk menggabungkan atau membagi dokumen pdf dan memutar, memotong dan mengatur ulang halaman mereka menggunakan antarmuka grafis interaktif dan intuitif. Ini adalah antarmuka untuk python-pyPdf.

Instalasi

sudo apt-get install pdfshuffler

Pemakaian

PDF-Shuffler dapat memotong dan menghapus satu halaman PDF. Anda dapat menggunakannya untuk mengekstrak rentang halaman dari dokumen atau bahkan sebagian halaman menggunakan fungsi pemotongan:

masukkan deskripsi gambar di sini


Elemen halaman - Inkscape


Gambaran

Inkscape adalah editor grafis vektor open-source yang sangat kuat. Ini mendukung berbagai format yang berbeda, termasuk file PDF. Anda dapat menggunakannya untuk mengekstrak, memodifikasi, dan menyimpan elemen halaman dari file PDF.

Instalasi

sudo apt-get install inkscape

Pemakaian

1.) Buka file PDF pilihan Anda dengan Inkscape. Dialog impor akan muncul. Pilih halaman tempat Anda ingin mengekstrak elemen. Biarkan pengaturan lain apa adanya:

masukkan deskripsi gambar di sini

2.) Dalam Inkscape klik dan seret untuk memilih elemen yang ingin Anda ekstrak:

masukkan deskripsi gambar di sini

3.) Balikkan seleksi dengan !dan hapus objek yang dipilih dengan DELETE:

masukkan deskripsi gambar di sini

4.) Pangkas dokumen ke objek yang tersisa dengan mengakses dialog Properti Dokumen dengan CTRL+ SHIFT+ Ddan pilih "sesuaikan dokumen dengan gambar":

masukkan deskripsi gambar di sini

5.) Simpan dokumen sebagai file PDF dari File -> Save as dialog:

6.) Jika ada gambar bitmap / raster dalam dokumen yang Anda potong, Anda dapat mengatur DPI mereka dalam dialog yang muncul berikutnya:

masukkan deskripsi gambar di sini

7.) Jika Anda mengikuti semua langkah, Anda akan menghasilkan file PDF sejati yang hanya terdiri dari objek-objek pilihan Anda:

masukkan deskripsi gambar di sini

Glutanimate
sumber
Usaha yang bagus. Terima kasih! Saya mengerti bahwa itu tidak memungkinkan untuk memilih sebagian halaman, tetapi hanya seluruh halaman. Apakah saya benar?
carnendil
2
@carnendil: Ya, persis. Saya tidak berpikir ghostscript mampu melakukannya. Tetapi mungkin ada solusi lain di luar sana untuk melakukan ini secara terprogram . Untuk saat ini saya telah mengedit jawaban saya dengan solusi alternatif (dan sedikit meretas) menggunakan PDF-shuffler.
Glutanimate
3
ok, saya telah menambahkan metode yang berbeda menggunakan Inkscape.
Glutanimate
1
pdfshufflertidak cukup jika Anda ingin mengekstrak bagian dari halaman PDF. Data PDF asli halaman masih tersimpan dalam file. Jangan gunakan metode ini jika Anda ingin menghapus data sensitif dari file PDF.
Rob W
pdfshufflersekarang disebut pdfarranger.
Amoe
69

QPDF bagus. Gunakan cara ini untuk mengambil halaman 1-10 dari input.pdfdan menyimpannya sebagai output.pdf.

qpdf --pages input.pdf 1-10 -- input.pdf output.pdf

Harap dicatat bahwa input.pdfditulis dua kali.

Anda dapat menginstalnya dengan memohon:

sudo apt-get install qpdf

Ini adalah alat yang hebat untuk manipulasi PDF, yang sangat cepat, memiliki sedikit ketergantungan. "Ini dapat mengenkripsi dan membuat linierisasi file, mengekspos internal file PDF, dan melakukan banyak operasi lain yang berguna untuk pengguna akhir dan pengembang PDF."

http://sourceforge.net/projects/qpdf/

Ho1
sumber
3
Satu-satunya masalah yang saya miliki dengan ini adalah bahwa masih daftar semua halaman di daftar isi, meskipun sebagian besar dihapus. Selain itu, terima kasih yang brilian! :)
Wilf
3
Perangkat lunak hebat. Nice
Anwar
2
Peringatan - File semua besar ..tentang ukuran yang sama seperti aslinya.
Corey Alix
3
Berhasil, tetapi sintaks untuk menentukan halaman (daftar file input dua kali, kemudian menambahkan --) benar-benar aneh.
Dan Dascalescu
3
Bendera --pages memungkinkan Anda untuk menyambung halaman dari banyak PDF. Perhatikan bahwa Anda dapat menghindari duplikasi nama dengan menggunakan .di tempat file masukan dalam pilihan --pages: qpdf --pages . 1-10 -- input.pdf output.pdf.
Bart
43

Simpan ini sebagai skrip shell, seperti pdfextractor.sh:

#!/bin/bash
# this function uses 3 arguments:
#     $1 is the first page of the range to extract
#     $2 is the last page of the range to extract
#     $3 is the input file
#     output file will be named "inputfile_pXX-pYY.pdf"
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
   -dFirstPage="${1}" \
   -dLastPage="${2}" \
   -sOutputFile="${3%.pdf}_p${1}-p${2}.pdf" \
   "${3}"

Untuk menjalankan ketik:

./pdfextractor.sh 4 20 myfile.pdf
  1. 4 merujuk ke halaman itu akan memulai pdf baru.

  2. 20 merujuk ke halaman yang akan diakhiri dengan pdf.

  3. myfile.pdf adalah file pdf yang ingin Anda ekstrak bagiannya.

Outputnya akan berada myfile_p4_p20.pdfdi direktori yang sama dengan file pdf asli.

Semua ini dan informasi lebih lanjut di sini: Tip Teknologi

ThiagoPonte
sumber
15
Mari kita tetap sederhana:gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf
Ho1
dan Bagaimana cara menentukan file input?
Anwar
1
-1 untuk melakukan ekspansi parameter bash di luar string yang dikutip ganda. (harus "-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"dll. (perhatikan tanda kutip)).
Rotsor
1
@ Ho1 tolong tulis itu sebagai jawaban baru, ini sangat membantu!
Joshua Salazar
Ini adalah jawaban yang paling portabel, karena ghostscript kemungkinan akan dipasang cukup banyak di mana saja.
Calimo
29

Dalam sistem apa pun yang distribusi TeX diinstal:

pdfjam <input file> <page ranges> -o <output file>

Sebagai contoh:

pdfjam original.pdf 5-10 -o out.pdf

Lihat https://tex.stackexchange.com/a/79626/8666

Ioannis Filippidis
sumber
ini adalah satu-satunya yang bekerja untuk saya.
FireInTheSky
27

Ada utilitas baris perintah yang disebut pdfseparate .

Dari dokumen:

pdfseparate sample.pdf sample-%d.pdf

extracts  all pages from sample.pdf, if i.e. sample.pdf has 3 pages, it
   produces

sample-1.pdf, sample-2.pdf, sample-3.pdf

Atau, untuk memilih satu halaman (dalam hal ini, halaman pertama) dari file sample.pdf:

pdfseparate -f 1 -l 1 sample.pdf sample-1.pdf
jdmcbr
sumber
2
alat hebat! jauh lebih cepat daripdftk
Anwar
3
Bagus, tetapi hanya terbatas pada satu halaman, dan jika Anda menginginkan lebih dari itu, Anda akan mendapatkan halaman terpisah.
Ho1
2
Tentu, meskipun seseorang dapat mengikuti perintah di atas dengan pdfunite untuk menghasilkan satu dokumen.
jdmcbr
3
Jika Anda memiliki dokumen besar dan perlu membagi semua halaman, itu sangat cepat dan bermanfaat.
MEDVIS
19

pdftk( sudo apt-get install pdftk) juga merupakan baris perintah yang bagus untuk manipulasi PDF. Berikut ini beberapa contoh yang pdftkdapat dilakukan:

   Collate scanned pages
     pdftk A=even.pdf B=odd.pdf shuffle A B output collated.pdf
     or if odd.pdf is in reverse order:
     pdftk A=even.pdf B=odd.pdf shuffle A Bend-1 output collated.pdf

   Join in1.pdf and in2.pdf into a new PDF, out1.pdf
     pdftk in1.pdf in2.pdf cat output out1.pdf
     or (using handles):
     pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf
     or (using wildcards):
     pdftk *.pdf cat output combined.pdf

   Remove page 13 from in1.pdf to create out1.pdf
     pdftk in.pdf cat 1-12 14-end output out1.pdf
     or:
     pdftk A=in1.pdf cat A1-12 A14-end output out1.pdf

   Burst a single PDF document into pages and dump its data to
   doc_data.txt
     pdftk in.pdf burst

   Rotate the first PDF page to 90 degrees clockwise
     pdftk in.pdf cat 1east 2-end output out.pdf

   Rotate an entire PDF document to 180 degrees
     pdftk in.pdf cat 1-endsouth output out.pdf

Dalam kasus Anda, saya akan melakukan:

     pdftk A=input.pdf cat A<page_range> output output.pdf
Andrzej Pronobis
sumber
Paket 'pdftk' tidak memiliki kandidat instalasi
FireInTheSky
8

Sudahkah Anda mencoba PDF Mod?

Anda dapat misalnya .. mengekstrak halaman dan menyimpannya sebagai pdf.

Deskripsi:

PDF Mod adalah alat sederhana untuk memodifikasi dokumen PDF. Itu dapat memutar, mengekstrak, menghapus
dan menyusun ulang halaman melalui seret dan lepas. Beberapa dokumen dapat digabungkan melalui seret
dan lepas. Anda juga dapat mengedit judul, subjek, penulis, dan kata kunci dari
dokumen PDF menggunakan PDF Mod.

Instal melalui pusat perangkat lunak

Semoga ini bermanfaat.

Regars.

Raguet Romawi
sumber
YA, saya benar-benar mencobanya tetapi TIDAK mengizinkan saya untuk menyimpan sebagian halaman misalnya plot sebagai pdf ... Kecuali saya tidak melihat opsi. Ini memungkinkan saya untuk mengekstrak seluruh halaman dari dokumen tapi bukan itu yang saya inginkan
user72469
Saya menggunakannya secara teratur, alat yang hebat! tapi saya punya dokumen dengan sekitar 170 halaman yang tidak bisa ditangani pdfmod.
loved.by.Yesus
Wow. Ini sangat halus. Melemparkan buku nyata 512 halaman saya ke sana (50MiB) dan itu ... cepat. UI sangat mudah. Untuk pecandu CLI seperti saya, dibutuhkan beberapa tingkat GUI untuk meyakinkan saya, tetapi ini akan berhasil!
lihat
PDF Mod memiliki bug yang berjalan di Kubuntu 18
Joshua Salazar
8

Saya mencoba melakukan hal yang sama. Yang harus Anda lakukan adalah:

  1. pasang pdftk:

    sudo apt-get install pdftk
    
  2. jika Anda ingin mengekstrak halaman acak:

    pdftk myoldfile.pdf cat 1 2 4 5 output mynewfile.pdf
    
  3. jika Anda ingin mengekstrak rentang:

    pdftk myoldfile.pdf cat 1-2 4-5 output mynewfile.pdf
    

Silakan periksa sumber untuk info lebih lanjut.

Kode
sumber
Saya menemukan jawaban ini terbaik karena ini menunjukkan bagaimana Anda dapat memasukkan beberapa rentang.
Roman Luštrik
6

Ternyata, saya bisa melakukannya dengan imagemagick. Jika Anda tidak memilikinya, instal dengan:

sudo apt-get install imagemagick

Catatan 1 : Saya sudah mencoba ini dengan pdf satu halaman (saya belajar menggunakan imagemagick, jadi saya tidak ingin lebih banyak masalah daripada yang diperlukan). Saya tidak tahu apakah / bagaimana cara kerjanya dengan banyak halaman, tetapi Anda dapat mengekstrak satu halaman yang menarik dengan pdftk:

pdftk A=myfile.pdf cat A1 output page1.pdf

di mana Anda menunjukkan nomor halaman yang akan dibagi (dalam contoh di atas, A1pilih halaman pertama).

Catatan 2 : Gambar yang dihasilkan menggunakan prosedur ini akan menjadi raster.


Buka pdf dengan perintah display, yang merupakan bagian dari imagemagicksuite:

display file.pdf

Milik saya terlihat seperti ini:

tampilan imagemagick dari pdf
Klik pada gambar untuk melihat versi resolusi penuh

Sekarang Anda klik pada jendela dan menu akan muncul ke samping. Di sana, pilih Transform | Pangkas .

imagemagick transform> crop menu

Kembali di jendela utama, Anda dapat memilih area yang ingin Anda potong dengan hanya menyeret pointer (pemilihan sudut-ke-sudut klasik).

pemilihan area untuk dipangkas
Perhatikan penunjuk berbentuk tangan di sekitar gambar saat memilih

Pilihan ini dapat disempurnakan sebelum melanjutkan ke langkah berikutnya.

Setelah Anda selesai, perhatikan persegi panjang kecil yang muncul di sudut kiri atas (lihat gambar di atas). Ini menunjukkan dimensi area yang dipilih pertama (misalnya 281x218) dan kedua koordinat sudut pertama (misalnya +256+215)

Tuliskan dimensi dari area yang dipilih; Anda akan membutuhkannya saat menyimpan gambar yang dipotong.

Sekarang, kembali ke menu pop (yang sekarang adalah menu "potong" khusus), klik tombol Potong .

menu krop imagemagick

Terakhir, setelah Anda puas dengan hasil pemangkasan, klik menu File | Menyimpan

Arahkan ke folder tempat Anda ingin menyimpan pdf yang dipotong, ketikkan nama, klik tombol Format , pada jendela "Pilih tipe format gambar" pilih PDF dan klik tombol Pilih . Kembali pada jendela "Browse dan pilih file", klik tombol Simpan .

imagemagick simpan sebagai pdf

Sebelum menyimpan, imagemagickakan diminta untuk "memilih geometri halaman". Di sini, Anda mengetik dimensi gambar yang dipangkas, menggunakan huruf "x" sederhana untuk memisahkan lebar dan tinggi.

imagemagick pilih geometri halaman

Sekarang, Anda dapat melakukan semua ini dengan sempurna dari baris perintah (perintahnya convertdengan opsi -crop) - tentunya lebih cepat, tetapi Anda harus tahu sebelumnya koordinat gambar yang ingin Anda ekstrak. Periksa man convertdan contoh di halaman web mereka .

carnendil
sumber
Saya tidak tahu tentang GUI imagemagick. Terlihat menarik. Namun, tolong koreksi saya jika saya salah, tetapi saya pikir imagemagick tidak dapat menangani gambar yang di-vektor. Jadi apa yang Anda ekspor kemungkinan akan menjadi gambar raster / bitmap saja. Dalam hal ini metode ini sama dengan mengambil screenshot dari suatu wilayah dokumen.
Glutanimate
1
Memang, imagemagickhanya berfungsi gambar raster, dan displayhanya satu perintah dari suite. Ada banyak antarmuka untuk imagemagick- periksa halaman web mereka. Untuk gambar vektor, solusi terbaik adalah, saya pikir, metode Anda dengan Inkscape.
carnendil
2
Anda mungkin ingin menambahkan sangkalan di bagian atas jawaban sebagai peringatan bahwa ini akan mengkonversi dari vektor ke grafik raster. Properti ini menjadikannya pendekatan yang berbeda secara mendasar.
bluenote10
2

PDF Split and Merge sangat berguna untuk ini dan operasi manipulasi PDF lainnya.

Unduh dari sini

Melakukan
sumber
1
Anda dapat mengunduh versi terbaru dari tautan di atas, tetapi jika Anda lebih suka kenyamanan Pusat Perangkat Lunak, Anda juga dapat menginstalnya dari sana (atau dari terminal, melalui sudo apt-get install pdfsam). Namun, versi di Ubuntu sudah cukup usang, karena masih dalam versi 1.1.4 sedangkan versi sourceforge sudah 2.2.2.
Waldir Leoncio
3.x terbaru (saat ini 3.1.0) memiliki paket deb. Yang dapat diinstal di Ubuntu dan memiliki modul Extract Pages yang melakukan apa yang diminta OP
Andrea Vacondio
1
@Andrea Vacondio Bravo untuk hasil edit Anda yang luar biasa! Anda membantu membuat internet aman. Saya menemukan bahwa file dari tautan lama di sourceforge.net memiliki omong kosong yang tertanam di dalamnya. Pemilik baru situs web SourceForge mengatakan mereka akan berhenti melakukan ini, tetapi jelas mereka berbohong.
karel
2

Ketika pengguna awal meminta alat interaktif dan bukan alat baris perintah: Solusi mudah adalah dengan menggunakan penampil PDF (okular di Kubuntu, evince atau bahkan Firefox di Ubuntu) dan kemudian gunakan dialog cetak standar, pilih "cetak untuk File PDF ", dan kemudian pilih dialog pengaturan yang diperluas, halaman mana yang akan" dicetak ". Varian ini memiliki beberapa kelemahan, karena beberapa tipuan pada PDF asli (seperti halaman yang dirotasi, formulir, dll.) Mungkin hilang, tetapi berfungsi langsung untuk sebagian besar PDF sederhana.

Kai Petzke
sumber
0

Jika Anda ingin mengekstrak dari PDF Anda, Anda dapat menggunakan http://www.sumnotes.net . Ini alat yang luar biasa untuk mengekstrak catatan, sorotan, dan gambar dari PDF. Anda juga dapat menonton tutorial di Youtube dengan mengetik sumnotes.

Saya harap Anda akan menikmatinya!

James
sumber