Saya ingin mengonversi .pdf
file ke .odt
file sehingga saya dapat lebih lanjut mengonversinya menjadi .doc
file. Apakah ada perangkat lunak / skrip yang dapat melakukan ini. Saya telah mencoba untuk menyalin konten .pdf
file dan menempelkannya di penulis liberoffice format tidak terpelihara.
Dokumen ini bersifat rahasia sehingga saya lebih suka tidak menggunakan layanan online untuk konversi.
Bantuan apa pun sangat dihargai.
format-conversion
Ankit
sumber
sumber
Jawaban:
Saya terganggu oleh kurangnya konverter PDF ke ODT gratis juga. Aku bahkan tidak butuh sesuatu yang rumit. Hanya alat yang menghasilkan file ODT yang kemudian dapat saya anotasi di LibreOffice (misalnya untuk mengisi formulir).
Saya tahu bagaimana melakukan ini secara manual, dengan mengubah dokumen PDF menjadi file grafik dan kemudian mengimpornya ke LibreOffice, tetapi itu membosankan cukup cepat.
Jadi, saya akhirnya menulis skrip shell kecil cepat yang melakukan semua langkah yang diperlukan secara otomatis. Anda dapat menemukannya di https://github.com/gutschke/pdf2odt
Ini dapat mengambil sejumlah file PDF dan gambar sebagai input dan menghasilkan file ODT yang dapat dibuka dan diedit di LibreOffice. Gambar ditampilkan sebagai latar belakang halaman, sehingga Anda dapat menuliskannya dengan bebas. Setiap gambar dikaitkan dengan gaya halamannya sendiri. Ingatlah hal itu, saat menyisipkan page break dan sesuaikan gaya halaman seperlunya.
Saya menguji skrip pada Linux dan Mac. Mengingat bahwa itu hanya membutuhkan beberapa alat yang cukup standar, itu harus cukup portabel.
sumber
pdf2oo
beberapa tahun yang lalu, tetapi sekarang sepertinya menghasilkan file yang korup untuk LibreOffice. Script ini melakukan itu dan banyak lagi - terima kasih!Anda bisa melihatnya
PDF Utilities
(poppler-utils via Synaptic atau apt-get) yang mencakup pdftotext :Tentu saja, kesuksesan akan tergantung pada bagaimana file pdf dihasilkan. Jika Anda mendapatkan apa yang Anda inginkan sebagai file teks, Anda kemudian bisa menyimpan bahwa sebagai file odt.
Sunting: Saya lupa memberikan sumber untuk kutipan. Itu dari tab deskripsi di Synaptic for
PDF Utilities (based on Poppler).
sumber
pdftohtml
harus paling cocok untuk tugas itu, karena HTML dapat membawa format. Kemudian HTML dapat dikonversi ke ODT atau DOC.LibreOffice mampu mengimpor
.pdf
file. Cukup buka di versi LibreOffice saat ini untuk hasil terbaik. Namun, itu akan membuka dokumen sebagai gambar, dan Anda akan dapat mengonversinya hanya ke salah satu format gambar yang didukung, bukan sebagai dokumen Writer.Secara alami, tidak semua pemformatan dipertahankan, tetapi setidaknya sebagian.
sumber
Jika paket poppler-utils diinstal, skrip Nautilus di bawah ini (untuk ditempatkan di folder ~ / .gnome2 / nautilus-scripts sebagai file yang dapat dieksekusi) akan membantu mengonversi file PDF ke HTML (opsi "-i" dapat dihapus untuk menyertakan gambar juga), yang kemudian dapat dibuka dengan LibreOffice Writer dan disimpan sebagai ODT meskipun keberhasilan konversi format sangat tergantung pada bagaimana PDF dibuat.
http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym
sumber
man pdftohtml
):-noframes : generate no frames. Not supported in complex output mode.
Jadi-noframes
tidak akan berpengaruh dengan-c
set.Coba Kaliber. Itu dikonversi ke html dan kemudian ke format lain. Itu melakukan pekerjaan yang cukup baik pada file besar (183 halaman) yang seharusnya saya cetak.
Dalam kasus saya, saya mengubahnya menjadi sebuah epub, tetapi untuk bersenang-senang hanya mengubahnya menjadi .docx yang ternyata sangat baik.
sumber