Konversikan halaman web menjadi satu file untuk ebook

22

Saya ingin mengunduh HTML (contoh: http://www.brpreiss.com/books/opus6/ ) dan bergabung dengan satu HTML atau format lain yang dapat saya gunakan pada pembaca ebook. Situs dengan buku gratis tidak memiliki paging standar, itu bukan blog atau forum, jadi tidak tahu bagaimana melakukan perayapan dan penggabungan otomatis.

Hrvoje Hudo
sumber

Jawaban:

13

Anda dapat menggunakan Calibre untuk kebutuhan konversi ebook Anda. Anda bisa mendapatkannya untuk membuat satu ebook dari banyak file HTML dengan menautkannya dari satu file HTML yang Anda setup sebagai daftar isi seperti ini .

Tuan Alpha
sumber
Saya menggunakan Sigil untuk konversi ke EPUB, tetapi tidak tahu bahwa Cailbre dapat membuat satu ebook dari sekelompok html yang tertaut. Saya akan mencoba, thanx!
Hrvoje Hudo
1
Anda dapat menggunakan httrack.com untuk mengunduh laman web, lalu gunakan Kaliber untuk mengonversikan semuanya menjadi format ePub.
에이 바
3
Proses saya adalah (menggunakan Chrome) untuk menggunakan bookmarklet Teks Instapaper untuk membersihkan segalanya, lalu klik kanan -> Simpan Sebagai, pilih untuk menyimpan sebagai satu halaman web, Hanya HTML, lalu buka ini di Calibre, konversikan ke EPub, kemudian gunakan fungsi Edit Book untuk merapikan sedikit tambahan markup berantakan yang ditarik.
El Yobo
7

Cara saya melakukan ini adalah Calibre.

Itu menjadi terlalu banyak rasa sakit jadi saya membangun Ekstensi Chrome untuk membuatnya lebih mudah.

Ini disebut EpubPress ( http://epub.press ).

Ini memungkinkan Anda membuat ebook dari tab Chrome Anda.

Semoga itu bisa membantu!

HaroldT
sumber
2
Situs web di tautan Anda menunjukkan bahwa pengemasan terjadi pada server pihak ke-3, privasi TIDAK dijamin dengan metode ini.
Burgi
Apakah Anda memiliki saran untuk perubahan yang akan membuat Anda merasa lebih aman? Saya telah melakukan yang terbaik untuk hanya membutuhkan informasi minimum untuk membuat buku, tetapi saya terbuka untuk umpan balik lebih lanjut. Jika Anda melihat layanan yang sebanding, Anda akan menemukan bahwa konten apa pun yang ingin Anda simpan dikirim ke server. Perbedaannya adalah bahwa layanan tersebut juga memerlukan akun dan memiliki semua konten yang terkait dengan nama Anda. Mereka juga tidak menyediakan kode sumber untuk situs web mereka untuk memungkinkan Anda melihat apa yang mereka kumpulkan. Ekstensi adalah sumber terbuka dan saya senang menjawab pertanyaan apa pun tentang kode itu.
HaroldT
Alat yang luar biasa! Terima kasih banyak telah memberikannya kepada komunitas secara gratis!
vonjd
5

Pandoc dapat mengambil tautan ke halaman (atau file html) dan mengonversinya menjadi pdf / epub ...

Saya tidak yakin apakah itu merangkak. Jika tidak, Anda dapat merayapi laman terlebih dahulu dengan wget atau sesuatu (atau hanya mengumpulkan tautan) dan memberikannya kepada pandoc.

ananth.p
sumber
menurut halaman manual itu akan: "Alih-alih file, URI absolut dapat diberikan. Dalam hal ini pandoc akan mengambil konten menggunakan HTTP"
jopasserat
1

Anda dapat menggunakan https://getpocket.com dan resep saku dengan kaliber yang dapat diakses melalui menu "Ambil berita".

masukkan deskripsi gambar di sini

gagarine
sumber
0

HTTrack adalah pilihan yang baik - itu akan membangun sebuah ebook dari sebuah situs web: Tersedia untuk diunduh dari sini: https://www.httrack.com/ HTTrack "memungkinkan Anda untuk mengunduh situs World Wide Web dari Internet ke lokal direktori, membangun semua direktori secara rekursif, mendapatkan HTML, gambar, dan file lain dari server ke komputer Anda. HTTrack mengatur struktur tautan relatif situs asli. "

Anda kemudian dapat mengubah HTML menjadi EPUB, AZW3 atau PDF menggunakan Calibre, atau HTML lain untuk perangkat lunak konversi epub.

Opsi kedua untuk mengkonversi langsung ke EPUB adalah EpubPress: Ini memiliki ekstensi untuk memungkinkan penggunaan dari Firefox (hanya v44.0 +) atau Chrome. Untuk menggunakan perangkat lunak ini, Anda perlu membuka jendela browser. Setiap tab pada dasarnya adalah 'bab' dalam ebook Anda. Atur tab dalam urutan tampilan yang diinginkan, kemudian aktifkan epubpress - itu akan mengunduh dan mengatur tab dalam urutan penampilan, dalam format .epub. Semoga ini membantu!

* Namun, perhatikan bahwa unduhan EpubPress memisahkan laman web - bukan 'situs web', di HTTrack. Untuk mengunduh situs web dengan EpubPress Anda harus membuka setiap tautan di situs web sebagai tab terpisah, lalu gunakan Epubpress untuk mengumpulkan tautan-tautan ini ke dalam format .epub.

str8arrow
sumber