Menemukan metadata tentang PDF

32

Misalkan saya memiliki PDF dan saya ingin mendapatkan metadata apa pun yang tersedia untuk PDF itu. Utilitas apa yang harus saya gunakan?

Saya menemukan informasi yang biasanya paling menarik bagi saya adalah ukuran kertas, sesuatu yang biasanya tidak dilaporkan oleh pemirsa PDF. Misalnya apakah surat ukuran PDF, legal, A4 atau yang lainnya? Tetapi informasi lain yang tersedia mungkin menarik juga.

Sunting: Ini adalah panduan praktis untuk ukuran kertas, terima kasih kepada @terdon.

Faheem Mitha
sumber
1
Aneh. Mengapa seseorang membatalkan pertanyaan ini? Mau jelaskan?
Faheem Mitha

Jawaban:

39

Salah satu alat kanonik untuk ini adalah pdfinfo, yang dilengkapi dengan xpdf, jika saya ingat. Contoh output:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5
Ulrich Schwarz
sumber
1
Dalam Debian setidaknya ini adalah bagian dari poppler-utils. Saya punya file di sini yang laporan pdfinfo sebagai 595,2 x 841,44 poin. Tetapi ini tidak dilaporkan sebagai A4. Apa yang memutuskan untuk menandainya sebagai A4?
Faheem Mitha
2
Nama - nama tersebut hardcoded : huruf adalah 612 ± 0,1 x 792 ± 0,1, ukuran ajaib untuk DIN / ISO A adalah (semua ± 1 pt): 3370,98, 2383,64, 1685,49, 1191,82, 842,74, 595,91, ..., jadi sepertinya halaman Anda sedikit terlalu sempit untuk pdfinfomengambilnya.
Ulrich Schwarz
Begitu ya, sedikit kode if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))?
Faheem Mitha
Itu huruf, format A berada di loop dengan sqrt(2)s.
Ulrich Schwarz
13

Utilitas lain yang layak untuk dilihat adalah exiftool . Ini mungkin bukan alat yang tepat dalam kasus spesifik Anda karena tidak melaporkan informasi apa pun tentang geometri dokumen, tetapi secara umum itu mungkin alat yang paling lengkap untuk memeriksa metadata PDF.

Berikut adalah contoh perintah yang akan mencetak semua informasi meta yang tersedia ( -a), disortir berdasarkan grup ( -G1):

exiftool -a -G1 "$File"

Dokumentasi resmi menawarkan ikhtisar tag terkait yang didukung PDF:

Anda dapat menginstal exiftool di Debian / Ubuntu dengan:

sudo apt-get install libimage-exiftool-perl

Jika Anda lebih menyukai GUI, Anda bisa mencoba proyek PDFMtEd saya. Ini adalah seperangkat alat yang berfungsi sebagai antarmuka grafis untuk melakukan exiftool dan memungkinkan melihat dan mengedit metadata PDF.

Berikut ini beberapa tangkapan layar:

masukkan deskripsi gambar di sini

masukkan deskripsi gambar di sini

Glutanimate
sumber