Pertanyaan ini sudah ada jawabannya di sini:
Apakah ada cara untuk mengambil kode sumber dari setiap halaman web di situs web dan menyimpannya ke satu file teks? Dengan karakter CRFL yang tepat seperti jika halaman diambil secara individual di bawah Internet Explorer? Saya sudah mencoba Wget, tetapi sepertinya tidak dapat menemukan kombinasi opsi yang tepat.
Jawaban:
Jika server web telah dikonfigurasikan dengan benar, tidak, ini tidak mungkin. Ini karena jika Anda dapat mengunduh kode sumber situs web, Anda akan dapat mengambil data berharga seperti rincian otentikasi basis data situs web.
Namun Anda dapat mengunduh HTML halaman web yang dirender , seperti yang muncul di browser Internet Anda, dengan
wget
:Namun beberapa webservers dapat memperlakukannya
wget
sebagai robot (program yang menggores dan menyimpan data dari halaman web), dalam hal ini Anda dapat menggunakan-e robots=off
sakelar dalamwget
perintah Anda .sumber