Apakah Anda tahu cara mengekstrak bagian dari dokumen PDF dan menyimpannya sebagai PDF? Pada OS X itu benar-benar sepele dengan menggunakan Preview. Saya mencoba editor PDF dan program lain tetapi tidak berhasil.
Saya ingin sebuah program di mana saya memilih bagian yang saya inginkan dan kemudian menyimpannya sebagai pdf dengan perintah sederhana seperti CMD+ Npada OS X. Saya ingin bagian yang diekstraksi disimpan dalam format PDF dan bukan jpeg dll.
pdfshuffler
dalam repo.pdfshuffler
tidak berfungsi lagi di Ubuntu 14.04+. Anda selalu dapat menggunakan dialog cetak atau alternatif berbasis terminal sepertipdfseparate
apt-get
masih berfungsi dengan baik untuk saya dalam 16,04. Mungkin mereka memperbaiki bug, jika ada?Jawaban:
pdftk
adalah alat multi-platform yang berguna untuk pekerjaan itu ( homepage pdftk ).Anda meneruskan nama file pdf utama, lalu Anda katakan hanya menyertakan halaman-halaman tertentu (12-15 dalam contoh ini) dan mengeluarkannya ke file baru.
sumber
pdftk A=in.pdf cat A1-10 A15 A17 output out.pdf
pdftk
tidak tersedia di Ubuntu 18.04. (lihat askubuntu.com/questions/1028522/… )pdftk
tentu merupakan alat yang dapat melakukan pekerjaan itu, saya akan merekomendasikan menentangnya. Ini bukan perangkat lunak bebas, tetapi sepotong shareware yang kikuk. Juga membutuhkan JVM. Alat yang lebih masuk akal adalahqpdf
, seperti yang disarankan dalam jawaban lain .sangat sederhana, gunakan pembaca PDF default:
cetak sebagai file. hanya itu saja!
kemudian
sumber
Rentang halaman - Skrip Nautilus
Gambaran
Saya membuat skrip yang sedikit lebih maju berdasarkan pada tutorial @ThiagoPonte yang ditautkan. Fitur utamanya adalah
Tangkapan layar
Kode
Instalasi
Silakan ikuti instruksi instalasi generik untuk skrip Nautilus . Pastikan untuk membaca header skrip dengan hati-hati karena ini akan membantu untuk memperjelas pemasangan dan penggunaan skrip.
Halaman sebagian - PDF Shuffler
Gambaran
Instalasi
Pemakaian
PDF-Shuffler dapat memotong dan menghapus satu halaman PDF. Anda dapat menggunakannya untuk mengekstrak rentang halaman dari dokumen atau bahkan sebagian halaman menggunakan fungsi pemotongan:
Elemen halaman - Inkscape
Gambaran
Inkscape adalah editor grafis vektor open-source yang sangat kuat. Ini mendukung berbagai format yang berbeda, termasuk file PDF. Anda dapat menggunakannya untuk mengekstrak, memodifikasi, dan menyimpan elemen halaman dari file PDF.
Instalasi
Pemakaian
1.) Buka file PDF pilihan Anda dengan Inkscape. Dialog impor akan muncul. Pilih halaman tempat Anda ingin mengekstrak elemen. Biarkan pengaturan lain apa adanya:
2.) Dalam Inkscape klik dan seret untuk memilih elemen yang ingin Anda ekstrak:
3.) Balikkan seleksi dengan !dan hapus objek yang dipilih dengan DELETE:
4.) Pangkas dokumen ke objek yang tersisa dengan mengakses dialog Properti Dokumen dengan CTRL+ SHIFT+ Ddan pilih "sesuaikan dokumen dengan gambar":
5.) Simpan dokumen sebagai file PDF dari File -> Save as dialog:
6.) Jika ada gambar bitmap / raster dalam dokumen yang Anda potong, Anda dapat mengatur DPI mereka dalam dialog yang muncul berikutnya:
7.) Jika Anda mengikuti semua langkah, Anda akan menghasilkan file PDF sejati yang hanya terdiri dari objek-objek pilihan Anda:
sumber
pdfshuffler
tidak cukup jika Anda ingin mengekstrak bagian dari halaman PDF. Data PDF asli halaman masih tersimpan dalam file. Jangan gunakan metode ini jika Anda ingin menghapus data sensitif dari file PDF.pdfshuffler
sekarang disebutpdfarranger
.QPDF bagus. Gunakan cara ini untuk mengambil halaman 1-10 dari
input.pdf
dan menyimpannya sebagaioutput.pdf
.Harap dicatat bahwa
input.pdf
ditulis dua kali.Anda dapat menginstalnya dengan memohon:
Ini adalah alat yang hebat untuk manipulasi PDF, yang sangat cepat, memiliki sedikit ketergantungan. "Ini dapat mengenkripsi dan membuat linierisasi file, mengekspos internal file PDF, dan melakukan banyak operasi lain yang berguna untuk pengguna akhir dan pengembang PDF."
http://sourceforge.net/projects/qpdf/
sumber
--
) benar-benar aneh..
di tempat file masukan dalam pilihan --pages:qpdf --pages . 1-10 -- input.pdf output.pdf
.Simpan ini sebagai skrip shell, seperti pdfextractor.sh:
Untuk menjalankan ketik:
4
merujuk ke halaman itu akan memulai pdf baru.20
merujuk ke halaman yang akan diakhiri dengan pdf.myfile.pdf
adalah file pdf yang ingin Anda ekstrak bagiannya.Outputnya akan berada
myfile_p4_p20.pdf
di direktori yang sama dengan file pdf asli.Semua ini dan informasi lebih lanjut di sini: Tip Teknologi
sumber
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf
"-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"
dll. (perhatikan tanda kutip)).Dalam sistem apa pun yang distribusi TeX diinstal:
Sebagai contoh:
Lihat https://tex.stackexchange.com/a/79626/8666
sumber
Ada utilitas baris perintah yang disebut pdfseparate .
Dari dokumen:
Atau, untuk memilih satu halaman (dalam hal ini, halaman pertama) dari file sample.pdf:
sumber
pdftk
pdftk
(sudo apt-get install pdftk
) juga merupakan baris perintah yang bagus untuk manipulasi PDF. Berikut ini beberapa contoh yangpdftk
dapat dilakukan:Dalam kasus Anda, saya akan melakukan:
sumber
Sudahkah Anda mencoba PDF Mod?
Anda dapat misalnya .. mengekstrak halaman dan menyimpannya sebagai pdf.
Deskripsi:
PDF Mod adalah alat sederhana untuk memodifikasi dokumen PDF. Itu dapat memutar, mengekstrak, menghapus
dan menyusun ulang halaman melalui seret dan lepas. Beberapa dokumen dapat digabungkan melalui seret
dan lepas. Anda juga dapat mengedit judul, subjek, penulis, dan kata kunci dari
dokumen PDF menggunakan PDF Mod.
Semoga ini bermanfaat.
Regars.
sumber
Saya mencoba melakukan hal yang sama. Yang harus Anda lakukan adalah:
pasang
pdftk
:jika Anda ingin mengekstrak halaman acak:
jika Anda ingin mengekstrak rentang:
Silakan periksa sumber untuk info lebih lanjut.
sumber
Ternyata, saya bisa melakukannya dengan
imagemagick
. Jika Anda tidak memilikinya, instal dengan:Catatan 1 : Saya sudah mencoba ini dengan pdf satu halaman (saya belajar menggunakan
imagemagick
, jadi saya tidak ingin lebih banyak masalah daripada yang diperlukan). Saya tidak tahu apakah / bagaimana cara kerjanya dengan banyak halaman, tetapi Anda dapat mengekstrak satu halaman yang menarik denganpdftk
:di mana Anda menunjukkan nomor halaman yang akan dibagi (dalam contoh di atas,
A1
pilih halaman pertama).Catatan 2 : Gambar yang dihasilkan menggunakan prosedur ini akan menjadi raster.
Buka pdf dengan perintah
display
, yang merupakan bagian dariimagemagick
suite:Milik saya terlihat seperti ini:
Klik pada gambar untuk melihat versi resolusi penuh
Sekarang Anda klik pada jendela dan menu akan muncul ke samping. Di sana, pilih Transform | Pangkas .
Kembali di jendela utama, Anda dapat memilih area yang ingin Anda potong dengan hanya menyeret pointer (pemilihan sudut-ke-sudut klasik).
Perhatikan penunjuk berbentuk tangan di sekitar gambar saat memilih
Pilihan ini dapat disempurnakan sebelum melanjutkan ke langkah berikutnya.
Setelah Anda selesai, perhatikan persegi panjang kecil yang muncul di sudut kiri atas (lihat gambar di atas). Ini menunjukkan dimensi area yang dipilih pertama (misalnya
281x218
) dan kedua koordinat sudut pertama (misalnya+256+215
)Tuliskan dimensi dari area yang dipilih; Anda akan membutuhkannya saat menyimpan gambar yang dipotong.
Sekarang, kembali ke menu pop (yang sekarang adalah menu "potong" khusus), klik tombol Potong .
Terakhir, setelah Anda puas dengan hasil pemangkasan, klik menu File | Menyimpan
Arahkan ke folder tempat Anda ingin menyimpan pdf yang dipotong, ketikkan nama, klik tombol Format , pada jendela "Pilih tipe format gambar" pilih PDF dan klik tombol Pilih . Kembali pada jendela "Browse dan pilih file", klik tombol Simpan .
Sebelum menyimpan,
imagemagick
akan diminta untuk "memilih geometri halaman". Di sini, Anda mengetik dimensi gambar yang dipangkas, menggunakan huruf "x" sederhana untuk memisahkan lebar dan tinggi.Sekarang, Anda dapat melakukan semua ini dengan sempurna dari baris perintah (perintahnya
convert
dengan opsi-crop
) - tentunya lebih cepat, tetapi Anda harus tahu sebelumnya koordinat gambar yang ingin Anda ekstrak. Periksaman convert
dan contoh di halaman web mereka .sumber
imagemagick
hanya berfungsi gambar raster, dandisplay
hanya satu perintah dari suite. Ada banyak antarmuka untukimagemagick
- periksa halaman web mereka. Untuk gambar vektor, solusi terbaik adalah, saya pikir, metode Anda dengan Inkscape.PDF Split and Merge sangat berguna untuk ini dan operasi manipulasi PDF lainnya.
Unduh dari sini
sumber
sudo apt-get install pdfsam
). Namun, versi di Ubuntu sudah cukup usang, karena masih dalam versi 1.1.4 sedangkan versi sourceforge sudah 2.2.2.Ketika pengguna awal meminta alat interaktif dan bukan alat baris perintah: Solusi mudah adalah dengan menggunakan penampil PDF (okular di Kubuntu, evince atau bahkan Firefox di Ubuntu) dan kemudian gunakan dialog cetak standar, pilih "cetak untuk File PDF ", dan kemudian pilih dialog pengaturan yang diperluas, halaman mana yang akan" dicetak ". Varian ini memiliki beberapa kelemahan, karena beberapa tipuan pada PDF asli (seperti halaman yang dirotasi, formulir, dll.) Mungkin hilang, tetapi berfungsi langsung untuk sebagian besar PDF sederhana.
sumber
Jika Anda ingin mengekstrak dari PDF Anda, Anda dapat menggunakan http://www.sumnotes.net . Ini alat yang luar biasa untuk mengekstrak catatan, sorotan, dan gambar dari PDF. Anda juga dapat menonton tutorial di Youtube dengan mengetik
sumnotes
.Saya harap Anda akan menikmatinya!
sumber