Saya ingin mengunduh HTML (contoh: http://www.brpreiss.com/books/opus6/ ) dan bergabung dengan satu HTML atau format lain yang dapat saya gunakan pada pembaca ebook. Situs dengan buku gratis tidak memiliki paging standar, itu bukan blog atau forum, jadi tidak tahu bagaimana melakukan perayapan dan penggabungan otomatis.
ebook
web-crawler
Hrvoje Hudo
sumber
sumber
Cara saya melakukan ini adalah Calibre.
Itu menjadi terlalu banyak rasa sakit jadi saya membangun Ekstensi Chrome untuk membuatnya lebih mudah.
Ini disebut EpubPress ( http://epub.press ).
Ini memungkinkan Anda membuat ebook dari tab Chrome Anda.
Semoga itu bisa membantu!
sumber
Pandoc dapat mengambil tautan ke halaman (atau file html) dan mengonversinya menjadi pdf / epub ...
Saya tidak yakin apakah itu merangkak. Jika tidak, Anda dapat merayapi laman terlebih dahulu dengan wget atau sesuatu (atau hanya mengumpulkan tautan) dan memberikannya kepada pandoc.
sumber
Anda dapat menggunakan https://getpocket.com dan resep saku dengan kaliber yang dapat diakses melalui menu "Ambil berita".
sumber
HTTrack adalah pilihan yang baik - itu akan membangun sebuah ebook dari sebuah situs web: Tersedia untuk diunduh dari sini: https://www.httrack.com/ HTTrack "memungkinkan Anda untuk mengunduh situs World Wide Web dari Internet ke lokal direktori, membangun semua direktori secara rekursif, mendapatkan HTML, gambar, dan file lain dari server ke komputer Anda. HTTrack mengatur struktur tautan relatif situs asli. "
Anda kemudian dapat mengubah HTML menjadi EPUB, AZW3 atau PDF menggunakan Calibre, atau HTML lain untuk perangkat lunak konversi epub.
Opsi kedua untuk mengkonversi langsung ke EPUB adalah EpubPress: Ini memiliki ekstensi untuk memungkinkan penggunaan dari Firefox (hanya v44.0 +) atau Chrome. Untuk menggunakan perangkat lunak ini, Anda perlu membuka jendela browser. Setiap tab pada dasarnya adalah 'bab' dalam ebook Anda. Atur tab dalam urutan tampilan yang diinginkan, kemudian aktifkan epubpress - itu akan mengunduh dan mengatur tab dalam urutan penampilan, dalam format .epub. Semoga ini membantu!
* Namun, perhatikan bahwa unduhan EpubPress memisahkan laman web - bukan 'situs web', di HTTrack. Untuk mengunduh situs web dengan EpubPress Anda harus membuka setiap tautan di situs web sebagai tab terpisah, lalu gunakan Epubpress untuk mengumpulkan tautan-tautan ini ke dalam format .epub.
sumber