Apa yang menyebabkan ukuran file PDF bertambah saat menyimpan di Pratinjau?

17

Tampaknya melakukan pengeditan, anotasi, atau bahkan hanya membuka dan menyimpan file PDF di Pratinjau akan menyebabkan peningkatan ukuran file yang signifikan. Saya perhatikan bahwa untuk beberapa buku yang telah saya pindai ini juga terjadi untuk meningkatkan waktu rendering halaman.

Adakah yang bisa menjelaskan apa yang terjadi yang menyebabkan perubahan ini? Saya tertarik menyinkronkan anotasi ebooks PDF antara Pratinjau dan iPad (mungkin GoodReader) tetapi ini mungkin terlalu tidak praktis dengan file PDF besar.

Alex B
sumber
2
Ini kemungkinan disebabkan oleh bagaimana mereka memutuskan untuk menyandikan PDF dalam pratinjau. PDF sekarang merupakan format terbuka tetapi itu tidak berarti semua orang menyandikannya dengan cara yang sama. Taruhan teraman Anda adalah untuk mendapatkan editor Adobe PDF dan menggunakannya. Menurut orang-orang ini, discussion.apple.com/thread/3896311?start=0&tstart=0 , itu membuat perbedaan. Mereka juga membahas kemungkinan alasan di balik masalah Anda.
Tony

Jawaban:

12

Dalam novelnya yang tidak banyak diketahui, PDF Karenina , Leo Tolstoy menulis,

File PDF yang dikodekan secara optimal semuanya sama; setiap file PDF yang disandikan secara sub-optimal disandikan secara sub-optimal dengan caranya sendiri.

Sulit bagi siapa pun untuk menjawab mengapa file PDF Anda lebih besar setelah Pratinjau memodifikasinya. File PDF terdiri dari berbagai jenis data: gambar, aliran konten, font, overhead dokumen, ruang warna, status grafik yang diperluas, dan tabel referensi silang. Sama seperti satu kalimat yang ringkas dan bertele-tele, tetapi keduanya adalah bahasa Inggris yang valid dan mengatakan hal yang sama, demikian juga satu file PDF mungkin memiliki cara yang lebih verbose untuk merepresentasikan konten yang sama dengan file PDF yang lebih ringkas. Kami harus melihat file PDF Anda yang sebenarnya. Kemungkinannya mereka diciptakan oleh berbagai perangkat lunak yang berbeda, beberapa konsise, beberapa kurang begitu.

Juga penting versi Mac OS X dan Pratinjau apa yang Anda gunakan, karena itu menentukan perangkat lunak yang menulis file PDF baru saat Anda melakukan Save As in Preview.

Namun, saya dapat memberi tahu Anda apa yang menjadi lebih besar tentang beberapa file PDF saya . Kisah ini berlaku untuk komputer saya, yang menjalankan Mac OS X 10.5.8 dan Apple Preview 4.2 (469.5).

Satu file,, Giulio.pdfadalah dokumen 22 halaman dengan teks sebagai teks, bukan gambar yang dipindai. Besarnya 461.092 byte. Saya membukanya di Pratinjau, apakah File ... Save As ... , dan menyimpannya di bawah nama file baru. File baru adalah 724.421 byte, atau 57% lebih besar.

Saya membuka setiap file dengan Adobe Acrobat Professional, versi 8.3.1 untuk Mac OS. Saya melakukan Lanjutan ... PDF Optimizer ... Ruang Audit Penggunaan ... . Kotak dialog kecil memberikan rincian berapa banyak byte yang disebabkan oleh setiap kategori penggunaan, ditambah persen dari total ukuran file untuk kategori tersebut.

Dokumen asli Giulio.pdfmemiliki 390.754 byte (84,75%) yang ditujukan untuk aliran konten, dan nol byte yang ditujukan untuk gambar. Itu dalam format PDF 1.4. File yang disimpan oleh Pratinjau memiliki 675.846 byte (93,29%) yang ditujukan untuk aliran konten, juga nol byte gambar, dan dalam format PDF 1.3. Pratinjau membuat konten streaming 285.092 byte lebih besar, dan itu mewakili 73% dari perbedaan ukuran file antara keduanya.

Saya bertanya-tanya apakah format file PDF 1.3 pada dasarnya kurang efisien untuk menyimpan file jenis ini. Saya membuka yang asli Giulio.pdfdalam Adobe Acrobat Professional 8, dan melakukan Advanced ... PDF Optimizer ... Jadikan kompatibel dengan: Acrobat 3.0 dan yang lebih baru dan tekan OK. Saya menyimpan file yang dihasilkan dengan nama baru. File yang dihasilkan dalam format PDF 1.3, dan berukuran 452.356 byte, atau lebih kecil dari aslinya. Aliran kontennya adalah 375.171 byte (82,94%), proporsi yang sama, tetapi lebih kecil dari aliran konten file asli.

Dengan demikian tampaknya kita dapat menyimpulkan bahwa aplikasi Pratinjau pada Mac OS X 10.5.8 tidak seefisien beberapa pencipta PDF lainnya dalam membuat aliran konten singkat dalam file PDF, dan perbedaannya cukup untuk menjelaskan tiga perempat dari perbedaan ukuran. dalam file PDF tanpa gambar.

Saya melakukan percobaan serupa pada form k.pdf, dokumen 1 halaman dipindai dari kertas. File asli adalah 303.730 byte, dimana 298.197 byte (98,18%) adalah gambar. Salinan file ini dibuat oleh Pratinjau menggunakan Simpan Sebagai ... adalah 300.601 byte, atau 1% lebih kecil. Perbedaan ukuran file ini lebih dari diperhitungkan oleh kategori "dokumen overhead" yang lebih kecil dari byte dalam file yang dibuat oleh Pratinjau.

Jadi sepertinya kita juga dapat menyimpulkan bahwa Pratinjau tidak selalu menyebabkan ukuran file PDF bertambah besar. Itu tergantung pada sifat dari file PDF asli, dan seberapa ringkas untuk memulai.

Jim DeLaHunt
sumber
3

Saya tahu ini agak terlambat, tetapi saya telah menemukan sesuatu yang tampaknya berfungsi, setidaknya jika digunakan pada awalnya: Saya sudah mencoba menggunakan filter Kuarsa untuk "Mengurangi Ukuran File." Tampaknya berfungsi tetapi tidak diaktifkan secara default. Saya secara khusus dapat memilihnya melalui menu Simpan Sebagai (tahan Opsi), tetapi saya khawatir itu default untuk metode yang biasa di autosave.

Inilah yang terjadi pada saya dan bagaimana saya sampai di halaman ini di tempat pertama: PDF dimulai sebagai buku 91MB 900 halaman. Saya menambahkan satu anotasi dan menyimpannya dan file melompat hingga 2,29 GB. Selain itu, perlu waktu lama untuk menabung, terutama karena saya menyimpan ke drive eksternal. Syukurlah drive ini adalah USB 3!

Apakah ada cara untuk mengekstrak anotasi ini? Saya dapat membuat anotasi dan sorot pada Goodreader dan PDF Expert di iPad saya. Jika Pratinjau tidak memungkinkan saya untuk melakukan ini di komputer saya, apakah ada aplikasi lain yang akan melakukannya? Mengapa tidak bisa hanya menyimpan anotasi / highlight tetapi tidak mencoba untuk mengkompres ulang semua gambar seperti saya resetting JPEG setiap kali. Terima kasih untuk bantuannya!

Scott
sumber
Ini berfungsi: 400 KiB> 1,3 MiB> 540 KiB. PDF asli saya di bawah 400 KiB dan menjadi 1,3 MiB mengerikan setelah menambahkan beberapa highlight / garis bawahi. Saya melakukan seperti yang disarankan dan file turun ke 540 KiB: Save As ... dengan Filter Quartz diatur untuk Mengurangi Ukuran File . Saya masih dapat mengedit highlight sebelumnya (yang menjadi tidak mungkin dengan Ekspor sebagai PDF ... ) dan ukurannya lebih sesuai dengan yang saya dapatkan dengan mengeditnya di perangkat yang berbeda.
Daniel
1

Masalahnya tetap serius. Dalam Pratinjau 7.0 (Mac Os 10.9.5.) Saya menghasilkan pdf menggunakan Acrobat 9.5.5. yang menghasilkan file 5 MB. Dalam Pratinjau saya menambahkan tepat 12 karakter (menggunakan alat edit). Setelah menyimpan file ini, itu menjadi 14 MB.

Anda dapat memperbaikinya dengan membuka dan menyimpan lagi di Acrobat (mungkin harus menggunakan opsi "kurangi ukuran file").

Peter Uetz
sumber
2
Ini tidak menjelaskan mengapa itu terjadi yang merupakan pertanyaan.
Ian C.
0

Tidak dapat menambahkan petunjuk ke solusi. Saya dapat menambahkan skenario yang serupa (OS X 10.11.3): pdf pindaian yang berbobot ~ 800kb dibuka dalam pratinjau, beberapa halaman pindaian kosong dihapus, pdf pendek dua halaman yang dihasilkan adalah ~ 2,2Mb. "Opsi-Simpan sebagai" dan memilih filter kuarsa "kurangi ukuran file" mengkompres file ke ... 1,9 MB.

File asli telah dihasilkan oleh mesin fotokopi Xerox WC 7830, yang menurut pengalaman saya (dibandingkan dengan printer multi-fungsi sebelumnya / mesin fotokopi yang kami miliki) menghasilkan pdf pindaian yang dioptimalkan dengan cukup baik.

Tidak dapat melihat perbedaan dalam file, secara visual; Saya kira gambar halaman sedang dikompres ulang dalam 24bpp, sedangkan file aslinya jelas menggunakan jauh lebih sedikit warna, mungkin 6-bit (ini dokumen yang dicetak dan ditandatangani, hanya teks, pemindai membuat pekerjaan yang baik untuk menjaga latar belakang putih. Sayangnya, Pratinjau tidak cukup pintar untuk mendeteksi dan mempertahankan ini, dan tampaknya perlu mengkompres ulang seluruh file walaupun tidak ada perubahan yang dilakukan pada halaman yang tersisa (sekali lagi, hanya beberapa halaman yang telah dihapus.

Pimenta
sumber