Saya ingin menyimpan halaman web ini dan semua halaman yang terhubung dengannya. dan berharap memiliki tautan yang sama antara laman web yang disimpan.
Apakah ada beberapa cara alih-alih membuka dan menyimpan setiap halaman yang ditautkan?
Saya ingin menyimpan halaman web ini dan semua halaman yang terhubung dengannya. dan berharap memiliki tautan yang sama antara laman web yang disimpan.
Apakah ada beberapa cara alih-alih membuka dan menyimpan setiap halaman yang ditautkan?
Anda dapat melakukan apa yang Anda inginkan dengan utilitas baris perintah wget . Jika Anda memberikan -r
opsi, itu akan mengunduh halaman web secara rekursif. Sebagai contoh:
wget -r http://mat.gsia.cmu.edu/orclass/integer/integer.html
Ini akan mengunduh laman web itu dan apa pun tautannya. Anda juga dapat membuatnya hanya berulang sejumlah tingkat, untuk melakukan ini, Anda cukup memberikan -r
nomor. Seperti itu:
wget -r 5 http://mat.gsia.cmu.edu/orclass/integer/integer.html
Utas ini sudah tua sekarang, tetapi orang lain mungkin melihatnya. Terima kasih, Wuffers, karena mengarahkan saya ke arah yang benar tetapi, untuk memperluas jawaban Wuffers: Versi modern wget memiliki sejumlah opsi berguna untuk mengulangi tautan dan menambalnya menjadi tautan relatif lokal sehingga Anda dapat menavigasi salinan lokal dari situs web. Gunakan opsi -r untuk recurse, opsi -k untuk menambal tautan lokal, opsi -H untuk melintasi ke domain selain yang asli, opsi -D untuk membatasi domain yang Anda lintasi, opsi -l untuk membatasi kedalaman rekursi, dan opsi -p untuk memastikan bahwa daun traversal Anda memiliki semua yang mereka butuhkan untuk ditampilkan dengan benar. Misalnya, yang berikut ini akan mengunduh halaman dan segala sesuatu yang dengan segera terhubung, membuatnya dapat dijelajahi secara lokal,
wget -r -l 1 -p -k -H -D domain.com,relateddomain.com http://domain.com/page/in/domain
Dengan menggunakan perintah yang mirip dengan yang di atas, saya dapat mengunduh sepotong halaman wiki, dengan tautan eksternal, ke disk lokal saya tanpa mengunduh megabyte data asing. Sekarang, ketika saya membuka halaman root di browser saya, saya dapat menavigasi pohon tanpa koneksi internet. Satu-satunya gangguan adalah bahwa halaman root dikubur dalam subdirektori dan saya harus membuat halaman redirect tingkat atas untuk membuatnya nyaman untuk ditampilkan. Mungkin perlu beberapa percobaan dan kesalahan untuk memperbaikinya. Baca halaman manual wget dan bereksperimen.
sumber
Anda dapat menggunakan perayap situs web seperti httrack , yang gratis.
Dari situs web;
sumber