Apakah ada cara portabel untuk mengunduh atau menyimpan semua halaman situs web untuk dilihat secara offline? Saya memiliki penerbangan lintas negara besok, dan saya ingin dapat me- cache beberapa halaman web (khususnya halaman python doc ( http://docs.python.org/ ), dan referensi pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).
Idealnya saya ingin add-on Firefox atau sesuatu seperti itu, tetapi semuanya akan berfungsi dengan baik selama saya bisa menjalankannya di Linux.
Jawaban:
Saya menggunakan HTTrack .
sumber
Saya menggunakan wget dengan opsi ini untuk mencerminkan situs untuk penggunaan offline
dimana
-m mengaktifkan opsi mirroring untuk mirroring situs secara lokal
-c melanjutkan pengunduhan sebelumnya jika saya sudah mengunduh beberapa halaman
-k mengkonversi href absolut untuk menunjuk ke yang lokal untuk dilihat secara offline
-E memastikan file memiliki ekstensi .html setelah diunduh.
-np hanya mengunduh objek di bawah / a / section / i / dan tidak men-cache seluruh situs.
Misalnya saya ingin mengunduh dokumentasi selatan tetapi bukan tiket selatan, dll ...
Saya menggunakan Windows dan menjalankan wget di cygwin tetapi ada juga port windows asli wget .
Meskipun, dalam kasus Anda, Anda dapat mengunduh python offline docs dari bagian python docs
sumber
Coba http://www.downthemall.net/ plugin Firefox. Saya telah menggunakannya untuk mengunduh 250 halaman PDF dalam 20+ file terpisah. Ini sangat kuat. Ini memiliki sintaks wildcard / query yang memungkinkan Anda dengan operasi hanya mendapatkan file yang Anda inginkan dan tidak ada yang tidak relevan yang Anda tidak punya.
sumber
Beberapa ekstensi Firefox yang saya ketahui:
Buku kliping
ScrapBook Plus
UnMHT
Pocket (bukan ekstensi; fitur bawaan Firefox)
Perhatikan bahwa:
sumber
Anda dapat mengunduh seluruh situs web atau bagian dari situs web dengan wget.
Periksa manual wget untuk opsi lain yang mungkin ingin Anda lewati, misalnya untuk membatasi penggunaan bandwidth Anda, untuk mengontrol kedalaman rekursi, untuk mengatur daftar pengecualian, dll.
Pendekatan lain untuk penjelajahan offline adalah dengan menggunakan proxy caching. Wwwoffle adalah salah satu yang memiliki banyak fitur untuk memfasilitasi retensi untuk penjelajahan offline, seperti menimpa tanggal kedaluwarsa yang ditentukan server dan kemampuan pra-pengambilan rekursif. (Saya sudah menggunakan wwwoffle sejak hari dial-up.)
sumber