HTML rekursif ke PDF

12

Saya memiliki folder dengan struktur ini:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

dengan banyak sub folder dan hanya file html ... saya ingin mengonversikan semuanya menjadi pdf hanya menggunakan satu perintah atau skrip sederhana yang tidak memerlukan semua nama file.

Apakah kamu kenal satu?

Matteo Pagliazzi
sumber

Jawaban:

15

Saya akan menyarankan menginstal alat WKHtmlToPDF dari http://wkhtmltopdf.org/ (pindah dari: http://code.google.com/p/wkhtmltopdf/ ).

Anda kemudian dapat mengubah ke folder root dan menggunakan find dan xargs untuk mengubahnya:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Ini kemudian akan membangun PDF dengan setiap file HTML.

dan_linder
sumber
saya diselesaikan dengan daftar file dan bash untuk tetapi ini jauh lebih baik!
Matteo Pagliazzi
5

Perintah berikut harus melakukan pekerjaan untuk satu tautan:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Untuk banyak tautan, seharusnya tidak sulit untuk menulis loop yang menangani setiap tautan satu per satu.

jcollado
sumber