Adakah Cara untuk Mencerminkan Data yang Diperlukan Hanya untuk Muat Halaman index.html suatu Situs?

1

Saya mencoba untuk mencerminkan halaman arahan situs untuk melakukan pengujian.

Apakah ada cara untuk mencerminkan hanya tingkat pertama dari suatu situs? YAITU. semua permintaan harus menjadi file lokal hanya untuk halaman indeks pertama (tidak wget -m -k ).

Saya nyaman dengan baris perintah sehingga sesuatu yang menggunakan alat CLI sangat dapat diterima.

Terima kasih sebelumnya!

Tim Visher
sumber

Jawaban:

1

Untuk mendapatkan hanya halaman indeks situs dan persyaratannya, dan mengonversinya untuk rendering lokal, permohonan wget berikut (mengganti URL contoh dengan yang ingin Anda mirror, tentu saja) harus menghasilkan hasil yang diinginkan, mengunduh file ke direktori apa pun yang Anda masuki ketika Anda menjalankannya:

wget -r -l1 -k -nH http://www.example.com

Opsi menandakan sebagai berikut:

  • -r: Gunakan pencarian rekursif (ikuti tautan ke file lain).
  • -l1: Batasi kedalaman rekursi menjadi 1 (ikuti tautan dari URL yang diberikan pada baris perintah, tetapi tidak dari file yang diambil).
  • -k: Tulis ulang tautan absolut dalam file yang diambil untuk merujuk ke versi yang diunduh, bukan versi yang dihosting di laman web cermin.
  • -nH: Jangan membuat direktori per-hostname untuk file yang diunduh (jika tidak, jika Anda berada di mis. mis. /home/example/mirrorSemuanya masuk /home/example/mirror/www.example.com ).

Bergantung pada bagaimana situs target diatur, Anda mungkin perlu melakukan sedikit perubahan pada file yang diambil (misalnya, file dengan ekstensi .php mungkin tidak akan merender dengan benar ketika dibuka dari disk Anda, karena tidak ada server yang memberikan Content-Type tajuk untuk memberi tahu browser Anda bahwa mereka mengandung HTML). Ini seharusnya menjadi awal yang cukup solid.

Aaron Miller
sumber