Pengunduh situs web (cache?) Untuk melihat situs offline

9

Apakah ada cara portabel untuk mengunduh atau menyimpan semua halaman situs web untuk dilihat secara offline? Saya memiliki penerbangan lintas negara besok, dan saya ingin dapat me- cache beberapa halaman web (khususnya halaman python doc ( http://docs.python.org/ ), dan referensi pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Idealnya saya ingin add-on Firefox atau sesuatu seperti itu, tetapi semuanya akan berfungsi dengan baik selama saya bisa menjalankannya di Linux.

Falmarri
sumber
Anda dapat mencoba pengunduh situs web offline ini .
Menelaos Vergis

Jawaban:

15

Saya menggunakan HTTrack .

Ini memungkinkan Anda untuk mengunduh situs World Wide Web dari Internet ke direktori lokal, membangun semua direktori secara rekursif, mendapatkan HTML, gambar, dan file lain dari server ke komputer Anda

Edgar
sumber
Saya telah menggunakan yang satu ini di masa lalu, solusi gratis yang bagus.
MaQleod
1
HTTrack adalah yang terbaik untuk Linux dan Windows dan ada banyak pilihan opsi untuk mengonfigurasi proses pengunduhan .. Saya menyukainya
eslambasha
Saya juga menggunakannya; mereka sekarang menawarkan versi Android juga.
gparyani
-1 Itu tidak membangun "semua direktori" itu tidak mendapatkan semua "gambar dan file lain" .. Itu hanya mendapatkan apa yang ditautkan.
barlop
6

Saya menggunakan wget dengan opsi ini untuk mencerminkan situs untuk penggunaan offline

wget -cmkE -np http://example.com/a/section/i/like

dimana

-m mengaktifkan opsi mirroring untuk mirroring situs secara lokal

-c melanjutkan pengunduhan sebelumnya jika saya sudah mengunduh beberapa halaman

-k mengkonversi href absolut untuk menunjuk ke yang lokal untuk dilihat secara offline

-E memastikan file memiliki ekstensi .html setelah diunduh.

-np hanya mengunduh objek di bawah / a / section / i / dan tidak men-cache seluruh situs.

Misalnya saya ingin mengunduh dokumentasi selatan tetapi bukan tiket selatan, dll ...

wget -cmkE -np http://south.aeracode.org/docs/index.html

Saya menggunakan Windows dan menjalankan wget di cygwin tetapi ada juga port windows asli wget .

Meskipun, dalam kasus Anda, Anda dapat mengunduh python offline docs dari bagian python docs

Meitham
sumber
1

Coba http://www.downthemall.net/ plugin Firefox. Saya telah menggunakannya untuk mengunduh 250 halaman PDF dalam 20+ file terpisah. Ini sangat kuat. Ini memiliki sintaks wildcard / query yang memungkinkan Anda dengan operasi hanya mendapatkan file yang Anda inginkan dan tidak ada yang tidak relevan yang Anda tidak punya.

Rolnik
sumber
1

Beberapa ekstensi Firefox yang saya ketahui:

  • Buku kliping

    membantu Anda menyimpan halaman Web dan mengelola koleksi dengan mudah. Fitur utamanya adalah kemudahan, kecepatan, ketepatan, dan dukungan multi-bahasa. Fitur utama adalah:

    • Simpan halaman Web
    • Simpan cuplikan halaman Web
    • Simpan situs web
    • Atur koleksi dengan cara yang sama seperti Bookmark
    • Pencarian teks lengkap dan pencarian penyaringan cepat koleksi
    • Mengedit halaman Web yang dikumpulkan
    • Fitur edit teks / HTML menyerupai Opera's Notes
  • ScrapBook Plus

    Perbedaan antara ScrapBook Plus dan ScrapBook:

    • pemilahan lebih cepat
    • impor dan ekspor lebih cepat
    • buka jendela untuk mengelola koleksi Anda langsung dari bilah sisi
    • menyederhanakan penanganan "Combine Wizard"
    • fitur baru untuk "Tangkap Beberapa URL" (filter untuk mengecualikan tautan, gunakan judul situs web atau judul tautan sebagai judul baru untuk entri di bilah sisi, tentukan waktu tunggu antara untuk mengunduh dari 0 hingga 3 detik, gunakan UTF-8 atau ISO-8859-1 sebagai set karakter)
    • jendela "Capture" baru (unduhan harus dimulai secara manual, pengguliran otomatis dimatikan)
    • 6 stabilo di editor
  • UnMHT

    memungkinkan Anda untuk melihat file format arsip web MHT (MHTML), dan menyimpan halaman web lengkap, termasuk teks dan grafik, ke dalam satu file MHT

  • Pocket (bukan ekstensi; fitur bawaan Firefox)

    memungkinkan Anda menyimpan halaman web dan video ke Pocket hanya dalam satu klik. Pocket strip pergi berantakan dan menyimpan halaman dalam tampilan yang bersih, bebas gangguan dan memungkinkan Anda mengaksesnya saat bepergian melalui aplikasi Pocket.

    Perhatikan bahwa:

    Menyimpan dan mengakses daftar Pocket Anda di Firefox membutuhkan koneksi Internet. Tampilan offline dimungkinkan pada perangkat lain dengan aplikasi Pocket.

galacticninja
sumber
0

Anda dapat mengunduh seluruh situs web atau bagian dari situs web dengan wget.

wget -r http://docs.python.org/

Periksa manual wget untuk opsi lain yang mungkin ingin Anda lewati, misalnya untuk membatasi penggunaan bandwidth Anda, untuk mengontrol kedalaman rekursi, untuk mengatur daftar pengecualian, dll.

Pendekatan lain untuk penjelajahan offline adalah dengan menggunakan proxy caching. Wwwoffle adalah salah satu yang memiliki banyak fitur untuk memfasilitasi retensi untuk penjelajahan offline, seperti menimpa tanggal kedaluwarsa yang ditentukan server dan kemampuan pra-pengambilan rekursif. (Saya sudah menggunakan wwwoffle sejak hari dial-up.)

Gilles 'SANGAT berhenti menjadi jahat'
sumber