Identifikasi
Saya menemukan alat ini yang kelihatannya dapat Anda gunakan untuk mengidentifikasi file PDF / A. Ini disebut DROID (Rekaman Digital dan Identifikasi Objek) . Ini berbasis Java dan dapat dijalankan dari GUI atau baris perintah.
kutipan
DROID adalah alat perangkat lunak yang dikembangkan oleh The National Archives untuk melakukan identifikasi kumpulan otomatis format file. Dikembangkan oleh Departemen Pelestarian Digital sebagai bagian dari kegiatan pelestarian digitalnya yang lebih luas, DROID dirancang untuk memenuhi persyaratan mendasar dari setiap repositori digital untuk dapat mengidentifikasi format yang tepat dari semua objek digital yang disimpan, dan untuk menghubungkan identifikasi itu ke pusat registri. informasi teknis tentang format itu dan dependensinya.
Mengingat itu disponsori oleh Arsip Nasional, saya akan menganggap itu alat yang tepat untuk melakukan ini, mengingat tujuan yang dimaksudkan dari format PDF / A. Juga proyek ini open source dan kode tersedia di Github serta dikemas dalam bentuk biner dari situs Arsip Nasional .
Validasi & Konversi
Jika Anda mencari alat untuk melakukan validasi & konversi, saya yakin PDFBox dapat melakukan ini. PDFBox mencantumkan validasi PDF / A tepat di halaman depan situs web mereka. Ini aplikasi Java lain 8-).
kutipan dari situs web
PDF / A Validasi
Validasi PDF terhadap standar PDF / A ISO.
Di bawah bagian alat baris perintah di sebelah kiri halaman utama mereka menunjukkan penggunaan alat berikut:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF adalah alat lain yang mampu memvalidasi PDF / A; itu adalah bagian dari set alat referensi Open Preservation Foundation. Ini juga merupakan aplikasi Java.
Konversi
Untuk hanya melakukan konversi saya menemukan metode ini dari posting blog berjudul: Cara Gratis untuk mengkonversi PDF yang ada untuk PDF / A , yang menggunakan alat-alat berikut:
- Ghostscript 8.64 Hanya.
- PDFBox 0.7.3
- pdfmarks (file untuk memasok data meta tambahan)
- PDFA_def.ps
- USWebCoatedSWOP.icc
Dengan di atas di tempat Anda menggunakan perintah berikut:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
Bukan tanpa kutil. Artikel ini membahas salah satunya, memperbaiki bendera cetak pada hyperlink menjadi salah satunya. Artikel ini menyediakan aplikasi Java yang dapat Anda gunakan untuk memperbaikinya:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
Itu tidak cantik tetapi tampaknya bisa diterapkan. Lihat artikel untuk lebih jelasnya.
Referensi
pdfmarks
?Untuk identifikasi file, perintah
file
ini sering membantu. Ini akan mencari file Anda untuk angka ajaib, pengidentifikasi file, informasi penyandian, dll. Untuk memberikan informasi yang dapat membantu.Dalam kasus tertentu file PDF, utiliti
pdfinfo
sangat berguna. Dalam kasus saya, distribusi Gentoo, ini dikemas denganpoppler
, pustaka rendering PDF.sumber
pdfinfo -meta
dan melihatxmpmeta/RDF/Description/conformance
sepertinya mengatakan apakah PDF itu PDF / A (simpul ituA
) atau tidak (simpul itu tidak ada atau memiliki nilai lain). Ini awal!Berikut ini skrip baris perintah bash yang melakukan hal itu:
Simpan dalam file bernama pdf2pdfa.sh yang ada di jalur Anda, lalu panggil seperti ini:
pdf2pdfa.sh input.pdf
Ini akan membuat input_a.pdf.
sumber
input
? Aku mengertipdf_input
, tapi apa ituinput
? (3) Anda harus selalu mengutip variabel shell kecuali Anda memiliki alasan yang kuat untuk tidak melakukannya, dan Anda yakin tahu apa yang Anda lakukan. Tolong jangan menanggapi dalam komentar; edit jawaban Anda untuk membuatnya lebih jelas dan lebih lengkap.