Cara mengonversi PDF ke PDF / A

18

Universitas saya membutuhkan file PDF diserahkan ke dalam format PDF / A .

Saya mencoba mencari konverter, tetapi semuanya sangat mahal dan / atau rumit.

Bagaimana cara mengubah file PDF saya yang ada menjadi PDF / A?

Terima kasih banyak!

ben
sumber
1
Jika hanya dokumen pengolah kata dengan pemformatan sederhana, Anda dapat membukanya di OpenOffice dan menyimpannya sebagai PDF (OpenOffice memiliki ekspor PDF asli, tetapi saya tidak tahu apakah ini sesuai dengan PDF / A). Selain itu, tanyakan sekolah Anda apakah mereka dapat menyediakan alat apa pun, mengingat itu adalah persyaratan mereka untuk melakukan ini.
FrustratedWithFormsDesigner
3
@FrustratedWithFormsDesigner: LibreOffice memungkinkan Anda mengekspor dokumen teks sebagai PDF / A, seperti yang dijelaskan di sini .
ThatGuy
@ThatGuy -100 membaca pertanyaan: dia meminta untuk mengonversi PDF !!!
Tomas
1
@ Thomas: ¯ \ _ (ツ) _ / ¯ ... Saya tidak menjawab pertanyaan OP. Saya jelas menanggapi FrustratedWithFormsDesigner.
ThatGuy

Jawaban:

5

Untuk menyimpan dokumen Word yang ada ke PDF / A yang Anda butuhkan adalah versi terbaru dari Microsoft Word. Untuk membuat dari produk lain yang mencetak, Anda dapat menggunakan pencipta PDF / A gratis seperti yang ada di www.freepdfcreator.org

Jika Anda perlu memvalidasi bahwa file PDF / A sesuai, Anda dapat menggunakan layanan gratis kami di www.validatepdfa.com

Mengubah file PDF yang ada ke PDF / A dengan cara lossless sedikit lebih rumit dan tidak selalu mungkin. Acrobat 9 dan 10 dapat melakukan ini. Bisnis kami, Solid Documents, juga menjual produk yang melakukan ini (dan fungsi pengarsipan umum lainnya) dengan harga $ 99: Solid PDF Tools

Pragmatis
sumber
3
Sayangnya Free PDF Creator sering menyebabkan program yang saya coba cetak dari hang atau crash, dan secara singkat melontarkan beberapa popup tentang "penawaran khusus." Ketika saya menghubungi dukungan Solid Documents, saya disarankan bahwa "Versi gratis adalah rilis perantara, dan kami tidak dapat mempertimbangkan masalah-masalahnya."
Mark Berry
Jawaban Kurt Pfeifle di bawah ini jauh lebih baik.
mb21
16

PDF / A adalah standar ISO internasional untuk sebuah PDF rchiving. Standar meminta kepatuhan yang ketat terhadap seperangkat aturannya (seperti: "sematkan semua font", "jangan gunakan transparansi", "jangan gunakan JavaScript", "tanpa enkripsi", ...).

Ada banyak PDF di luar sana yang mengklaim sebagai PDF / A, tetapi gagal tes asap nyata. Klaim itu hanyalah tag di metadata file. Tag itu dapat membuat fe Acrobat Reader menampilkan petunjuk khusus saat merendernya.

Pemeriksaan untuk kepatuhan nyata memerlukan beberapa perangkat lunak "preflight" komersial yang agak ekspansif. Saat ini saya tidak mengetahui adanya utilitas gratis untuk melakukan pekerjaan itu. Lihat juga di sini untuk beberapa hasil tes: Isartor testsuite .

Anda dapat menggunakan Ghostscript untuk (mencoba) mengonversi PDF ke PDF / A. Cara melakukannya didokumentasikan di sini ( Pembaruan: untuk versi yang lebih baru di sini ).

Tetapi perhatikan: dokumen ini baru-baru ini diperbarui [ * ]. Versi sebelumnya dari Ghostscript's Ps2pdf.htm melakukan mis-lead pengguna untuk menjalankan perintah yang membuat PDF mengklaim sebagai PDF / A tetapi gagal tes asap nyata.

Cara mengonversi PDF ke PDF / A dengan Ghostscript:

Berikut ini adalah commandline:

gswin32c ^
   -dPDFA ^
   -dNOOUTERSAVE ^
   -dUseCIEColor ^
   -sProcessColorModel=DeviceCMYK ^
   -sDEVICE=pdfwrite ^
   -o output_pdfa.pdf ^
   -dPDFACompatibilityPolicy=1 ^
    PDFA_def.ps ^
    input.pdf

[ * ] Catatan: Masalahnya terletak pada parameter PDFA_def.ps. Ini adalah file yang perlu Anda edit untuk menyesuaikan kebutuhan Anda. Ghostscript dikirimkan bersama sampelnya di /libsubdirektori. Ini sampel tidak akan bekerja sebagai-adalah tanpa Anda menyuntingnya. Cara mengedit ada di dalam komentar sampel.

Kurt Pfeifle
sumber
Jadi aman untuk mengatakan bahwa PDF / A bukan format file per se, tetapi benar-benar hanya seperangkat persyaratan kepatuhan untuk membuat file PDF menggunakan teknologi yang ada?
JohnFx
3
@ JohnFx: sedikit banyak, ya. Setiap PDF / A-1b (atau PDF / A-1a) juga merupakan PDF yang valid dalam arti umum. Tetapi tidak setiap PDF berhasil divalidasi sebagai PDF / A *. Spesifikasi PDF / A- * melakukan 2 hal: (1) membatasi serangkaian fitur yang ditentukan dalam spesifikasi PDF-1.4 umum untuk subset dari yang diizinkan; (2) harus benar-benar mengikuti beberapa aturan yang dalam spesifikasi PDF umum adalah "lakukan atau tidak lakukan - sesuka Anda" (seperti menyematkan semua font yang digunakan).
Kurt Pfeifle
7

Saya menggunakan perintah berikut untuk mengonversi PDF ke PDF-A:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf PDFOriginal.ps

Jika Anda memiliki file PDF, pertama-tama konversikan ke PS agar berfungsi dengan kode di atas. Saya mencoba beberapa kali dengan file PDF untuk secara langsung dikonversi ke PDF-A. Namun, itu tidak berhasil.

Berikut adalah cara untuk mengonversi file PDF ke PS Anda:

pdftops PDFOriginal.pdf PDFOriginal.ps
soham
sumber
Sayangnya, PDF-PDF ini tidak diterima oleh universitas saya: /
Tomas
4

Alat ' Simpan sebagai PDF ' dari Microsoft Office 2007 disimpan dalam format PDF / A.

Dokumen PDF / A hanyalah dokumen PDF yang menggunakan subset tertentu dari PDF yang dirancang untuk memastikannya 'lengkap'. Yaitu tidak diizinkan untuk bergantung pada informasi dari sumber eksternal (mis. Program font dan hyperlink). Dari wikipedia :

Elemen kunci lain untuk kompatibilitas PDF / A termasuk:

* Audio and video content are forbidden.
* JavaScript and executable file launches are forbidden.
* All fonts must be embedded and also must be legally embeddable for
  unlimited, universal rendering. This also applies to the so-called     
  PostScript standard fonts such as Times or Helvetica.
* Colorspaces specified in a device-independent manner.
* Encryption is disallowed.
* Use of standards-based metadata is mandated.

Edit:

Karena ada tidak benar-benar alat untuk menguji apakah PDF adalah PDF / A, itu aman bertaruh bahwa seperti Anda, universitas Anda juga tidak memiliki cara untuk menguji bahwa dokumen Anda mengirim mereka adalah PDF / A .

Kemungkinan satu-satunya alasan mereka secara khusus memintanya adalah agar mereka dapat yakin bahwa semua konten akan "ada" ketika mereka membukanya. Mereka hanya menyatakan persyaratan ini agak samar (Dan buruk) sebagai itu harus PDF / A. Jadi cara sederhana untuk menguji apakah PDF memenuhi persyaratan sebenarnya dari self-Containment adalah dengan mentransfer PDF dan melihatnya dari komputer lain (lebih disukai offline) dan memastikan bahwa semuanya muncul sebagaimana mestinya.

imoatama
sumber
2
ah, apakah ada cara untuk menentukan apakah PDF yang ada adalah PDF atau PDF / A?
ben
1
@ Ben: Saya tidak tahu alat apa pun yang menentukan apakah PDF benar - benar PDF / A. PDF / A adalah sebuah standar ISO internasional untuk sebuah PDF rchiving. Standar meminta kepatuhan yang ketat terhadap serangkaian aturan ("sematkan semua font", "jangan gunakan transparansi"). Ada banyak PDF di luar sana yang mengklaim sebagai PDF / A, tetapi gagal tes asap nyata. Klaim itu hanyalah tag di metadata file. Tag itu dapat membuat fe Acrobat Reader menampilkan petunjuk khusus. Pemeriksaan untuk kepatuhan nyata memerlukan beberapa perangkat lunak komersial yang agak luas. Saya tidak mengetahui adanya utilitas gratis untuk melakukan pekerjaan itu.
Kurt Pfeifle
Terima kasih atas info Pipitas - kelihatannya bahkan uni tidak dapat memeriksa dengan pasti bahwa dokumen tersebut adalah PDF / A, dan karena itu bukan persyaratan yang sulit - lihat hasil edit saya.
imoatama
@imoatama: apakah Anda melihat jawaban saya yang lain? Ini menjelaskan cara mengkonversi PDF ke PDF / A. Jika Anda menggunakan -dPDFACompatibilityPolicy=0, PDF Anda akan mengklaim sebagai PDF / A bahkan jika proses konversi Ghostscript memperhatikan hal-hal yang tidak sesuai dan yang tidak dapat diperbaiki. Anda mungkin telah membuat semacam 'palsu' PDF / Seperti yang saya sebutkan di tempat lain ...
Kurt Pfeifle
MS Word 'save as PDF' juga mengklaim PDF itu PDF / A. Tidak perlu menggunakan Ghostscript.
imoatama
2

Di macOSX tanpa menggunakan pdftopsyang saya tidak dapat menginstal (seperti yang diusulkan @ soham.m17) Anda dapat melakukan:

pdf2ps oldPdf.pdf psVersionOfOldps.ps

untuk mengkonversi pdf Anda ke format ps dan kemudian:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf psVersionOfOldps.ps

untuk mengkonversi dalam pdf / A.

Francesco Pegoraro
sumber
1

Satu-satunya cara yang bekerja untuk saya di Windows 10 adalah sedikit modifikasi dari jawaban soham (yang bagi saya berfungsi tetapi dengan kesalahan):

  • mengonversikan PDFke ps(dengan pdf2ps source.pdf temp.ps)
  • mengonversi kembali pske PDF/Amenggunakan Ghostscript 9.22 dengan

gswin64c -dPDFA -dBATCH -dNOPAUSE -dPDFSETTINGS=/prepress -dNOOUTERSAVE -sColorConversionStrategy=UseDeviceIndependentColor -sProcessColorModel=DeviceRGB -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=destination.pdf temp.ps

(Anda mungkin perlu menambahkan sebelum gswin64cpath lengkap, yang bagi saya C:\Program Files\gs\gs9.22\bin\- sama untuk pdf2ps, dalam hal ini path untuk saya adalah C:\Program Files\gs\gs9.22\lib\)

Jika file yang dihasilkan terlalu besar, Anda dapat menghilangkan -dPDFSETTINGS=/prepressopsi. Tanpa opsi ini, file yang dihasilkan lebih kecil (bahkan lebih kecil dari aslinya dalam kasus saya), tetapi penurunan kualitas gambar dapat dicatat.

Hasilnya PDFtampaknya sesuai PDF/Abahkan tanpa -dNOOUTERSAVEopsi, meskipun lebih sedikit font yang tertanam (mungkin seseorang dapat menjelaskan perbedaannya).

Ketika saya mengatakan "sesuai dengan PDF/A" Maksud saya tidak hanya bahwa PDF/A"spanduk" muncul di Acrobat Reader tetapi file tersebut melewati validasi online yang disediakan oleh https://www.pdf-online.com/osa/validate.aspx

Saya tidak tahu seberapa besar layanan validasi online tersebut dapat diandalkan, namun ia berhasil mendeteksi file yang tidak sesuai yang menunjukkan PDF/A"spanduk" pada Acrobat Reader (yang karenanya tampaknya tidak dapat diandalkan dalam hal ini).

mmj
sumber
0

Jawaban sederhana:

Anda dapat menginstal Libre Office , gratis

Buka PDF dan simpan sebagai PDF ... [centang opsi PDF / A]

...kamu sudah selesai!

PYK
sumber