Jelajahi Struktur PDF Internal

18

Bagaimana cara menjelajah struktur PDF internal di adobe 9.0?

Saya tidak menemukan menu lanjutan yang memiliki opsi ini.

Bisakah ada yang membantu saya?


sumber

Jawaban:

23

Ada beberapa cara untuk menjelajahi struktur internal PDF.

PDF agak terbaca oleh manusia

Kecuali kata sandi keamanan, sebagian besar dapat dibaca oleh manusia. Jika PDF memiliki kata sandi, semua string dan stream (yang sudah dikompres, tidak akan hilang) akan menjadi pseudorandom sampah. Banyak data yang terkompresi mengalir, tetapi sebagian besar terlihat seperti ini di editor teks favorit Anda:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Peringatan: Ruang putih sebagian besar tidak relevan dan biasanya dihapus jika memungkinkan. Saya hanya membuat ini cantik untuk membuatnya lebih mudah memahaminya.

<< dan >> mulai dan akhiri "kamus". Kamus terdiri dari pasangan kunci / nilai. Kuncinya selalu berupa "nama": semua nama dimulai dengan '/'. Nilainya bisa apa saja, termasuk nama lain.

[ dan ] mulai dan akhiri "array". Array dapat terdiri dari apa saja.

Angka adalah "angka". Titik apung atau sebaliknya.

() dan <> mulai dan akhiri "string". <> string terdaftar sebagai nilai hex, () adalah string ANSI.

Pet Peeve: / Nama dan (Strings) menggunakan sistem pelarian yang sama sekali berbeda. Grr.

Referensi Tidak Langsung menunjuk ke objek lain dalam PDF:
<objNum> <generationNum-AlwaysZero> R

Dalam objek contoh di atas, aliran konten di objek 4, di tempat lain dalam PDF. Untuk menemukannya, Anda dapat menggunakan editor teks Anda mencari "N 0 obj" di mana N adalah nomor objek yang Anda inginkan.
PERINGATAN: Ada ratusan, mungkin ribuan objek dalam PDF. Mencari "1 0 obj" akan memberi Anda BANYAK hit.

Mengingat Anda meminta untuk melihat struktur internal, Anda mungkin sudah mengetahui semua ini. Orang lain yang ingin mengetahui hal yang sama mungkin tidak.

PERINGATAN: Jangan EDIT PDF di editor teks. Semua hal-hal biner akan hancur, byte byte sangat penting dalam PDF.

Plugin Acrobat [s]

Ada plugin acrobat yang disebut PDF CanOpener oleh Windjack Solutions (tidak ada afiliasi). Ini SLICK. Anda dapat menelusuri struktur PDF sebagai pohon, melihat (dan memodifikasi) aliran konten, dan sebagainya.

Aplikasi Pesta Thirdy

Banyak. Banyak orang membangunnya sebagai bagian dari belajar mengurai PDF, atau sebagai alat debugging. Mereka Cukup Berguna.

RUPS iText (bagian dari iText, Java PDF lib):
https://sourceforge.net/projects/itext/

Browser Objek PDF:
http://ulc-community.canoo.com/snipsnap/space/PDF+Object+Browser

PDF Vole:
https://java.net/projects/pdfvole

Tandai Storer
sumber
1
PDF Voletampaknya rusak sekarang ...
DNA
5
+1 untuk iText RUPS, bukan GUI yang ramah tetapi berfungsi, dengan cara saat ini tampaknya URL proyek ( sourceforge.net/projects/itextrups )
Jaime Hablutzel
2
RUPS iText telah dipindahkan ke sini: github.com/itext/rups
bmaupin
1
Ada salinan kode sumber pdfvole di sini: github.com/Rossi1337/pdf_vole
yms
String <> heksadesimal mengandung angka mesin terbang. Untuk mengonversinya menjadi karakter Unicode, gunakan ToUnicodepeta font. stackoverflow.com/a/22763451/99237
Tereza Tomcova
7

O2Solutions menawarkan utilitas yang kompatibel dengan MS Windows untuk melihat struktur internal dokumen PDF. Ini gratis untuk penggunaan pribadi dan komersial.

http://www.o2sol.com/pdfxplorer/overview.htm

AffineMesh
sumber
2

Editor PDF-XChange gratis memiliki panel Konten yang memungkinkan Anda melihat struktur pohon dari file PDF.

View -> Panes -> Content
Hüseyin Yağlı
sumber
2

PDF Vole tampaknya rusak. Jika ada yang masih mencari alat, saya menggunakan PDF Analyzer gratis .

masukkan deskripsi gambar di sini

juFo
sumber