Penampil / editor tag metadata PDF untuk Ubuntu

26

Ada banyak pertanyaan dan jawaban mengenai penampil PDF terbaik yang tersedia dengan Ubuntu, tetapi saya ingin mengurai file PDF dan mengetahui detail dari PDF, seperti gambar, font dan tautan yang tersedia dalam file PDF yang diberikan.

Apakah ada editor penampil / tag metadata PDF yang tersedia?

Sahil Grover
sumber
2
Tutup pemilih: Hanya karena pertanyaan ini mengatakan "terbaik" dalam judul tidak membuatnya berdasarkan opini!
Seth

Jawaban:

31
  1. Lihat metadata pdf untuk file bernama Example.pdf:

    pdfinfo Example.pdf  
    
  2. Edit metadata yang ada di terminal menggunakan editor nano:

    pdftk Example.pdf dump_data output Metadata-output.txt
    nano Metadata-output.txt  
    
  3. Perbarui metadata:

    pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
    

Pintasan keyboard editor nano
Gunakan kombinasi keyboard Ctrl+ Odan setelah itu tekan Enteruntuk menyimpan file ke lokasi saat ini.
Gunakan kombinasi keyboard Ctrl+ Xuntuk keluar dari nano.

karel
sumber
10

Solusi CLI

Utilitas lain yang layak untuk dilihat adalah exiftool . Kelebihan yang dimiliki exiftool dibandingkan pdfinfo adalah mendukung lebih banyak jenis metadata (mis. Tag XMP).

Berikut adalah contoh dari perintah yang akan mencetak semua informasi meta yang tersedia ( -a), disortir berdasarkan grup ( -G1):

exiftool -a -G1 "$File"

Ikhtisar tag terkait PDF yang didukung:

Anda dapat menginstal exiftool di Ubuntu dengan:

sudo apt-get install libimage-exiftool-perl

Solusi GUI

Jika Anda mencari penampil / editor metadata PDF GUI, Anda bisa mencoba PDFMtEd . Ini adalah satu set utilitas grafis yang saya tulis untuk mengelola metadata PDF dengan exiftool:

masukkan deskripsi gambar di sini

masukkan deskripsi gambar di sini

Glutanimate
sumber
1

Jawaban "terbaik" benar-benar tergantung pada seberapa banyak detail yang Anda inginkan dan pada seberapa stabil Anda ingin pemirsa. Ada banyak perangkat lunak untuk melihat dan bahkan mengedit skrip posting dan file pdf di linux; semua yang tampaknya telah dihapus dari repositori Ubuntu saat ini (mungkin karena masalah stabilitas).

Untuk saat ini saya akan merekomendasikan mencoba pdfedit. Jika Anda menggunakan Quantal atau sebelumnya, dapat diinstal via

sudo apt-get install pdfedit

Untuk rilis yang lebih baru, Anda harus mengunduhnya dari halaman proyeknya , membukanya, dan mengompilasinya sendiri.

virtualxtc
sumber
Saya tidak ingin pemirsa. Saya membutuhkan parser yang dapat mengambil detail dari file pdf seperti tautan yang tersedia di file .... gambar tersedia ... indeks file, dll.
Sahil Grover
Maaf, membuat pdftk bingung dengan pdfedit karena mereka menghapus pdfedit dari repositori
virtualxtc
0

Untuk menguraikan pdftkmetode pengeditan, yang bagus karena ini menunjukkan kepada Anda segala sesuatu yang sedang diatur, pada saat yang sama memungkinkan Anda untuk mengubah apa pun yang Anda suka, di sini adalah skrip (untuk .bashrcfile alias Anda atau lainnya) untuk melakukannya dengan satu perintah . Ini membuat versi baru dari file yang ingin Anda edit, membuka editor favorit Anda dengan metadatafile, dan kemudian mengimplementasikan perubahan Anda dan menetapkan waktu pembuatan / modifikasi file pada file PDF yang dimodifikasi agar sama dengan aslinya. Untuk menggunakannya, setelah melakukan resourcing .bashrcfile Anda , ketikkan saja

editPDFmetadata myfile.pdf

Inilah alias:

editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA  output $OUTPUT
touch -r ${1} ${OUTPUT}
}

Cukup letakkan definisi di atas ke dalam .bashrcfile di folder rumah Anda, lalu buka terminal baru dan siap digunakan.

CPBL
sumber
0

sudo apt-get install libimage-exiftool-perl

Metadata dapat dihapus sama sekali dengan perintah berikut

exiftool -all:all= file_name

Selamanya
sumber