Saya menggunakan wget untuk mengunduh file html, di mana gambar dalam file tersebut disimpan?

15

Firefox sedang memuat sangat lambat, jadi saya memutuskan untuk menggunakan wgetuntuk menyimpan file HTML. Saya menggunakan perintah berikut,

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

File-file telah disimpan di folder rumah saya. Tapi saya tidak tahu di mana gambar disimpan. Saya perlu menggunakannya Anki.

Jadi di mana foto-foto itu disimpan?

Pengguna Terdaftar
sumber
Artikel ini menjelaskan opsi dan bagaimana mereka berguna.
Wilf

Jawaban:

34

Saya lebih suka menggunakan --page-requisites( -psingkatnya) daripada di -rsini karena mengunduh semua halaman yang perlu ditampilkan tetapi tidak ada halaman lain, dan saya tidak perlu memikirkan jenis file apa yang saya inginkan.

Sebenarnya saya biasanya menggunakan sesuatu seperti

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Ini berarti:

  • -E: Tambahkan .htmlke nama file jika itu adalah file HTML tetapi tidak berakhir .htmlatau serupa
  • -H: Unduh file dari host lain juga
  • -k: Setelah mengunduh, konversikan tautan apa pun di dalamnya sehingga mengarah ke file yang diunduh
  • -p: Unduh apa pun yang dibutuhkan halaman untuk melihat offline dengan benar
Florian Diesch
sumber
Saya datang ke sini untuk mencari -H, dan senang untuk belajar tentang -Edan -kjuga. Terima kasih!
Charles Clayton
2

menggunakan parameter -r harus mengaktifkan wget untuk mengunduh seluruh folder, termasuk gambar Anda.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
vegard torvund
sumber
2

Mengunduh file gambar secara terpisah juga

Saya pikir perintah ini bisa membantu Anda memulai.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Ini memungkinkan Anda menentukan lokasi untuk menyimpan gambar dan jenis file apa yang Anda inginkan. Mungkin mengunduh gambar seperti itu lebih mudah.

Sumber :

-r memungkinkan pengambilan rekursif. Lihat Unduhan Rekursif untuk informasi lebih lanjut.

-P mengatur awalan direktori tempat semua file dan direktori disimpan.

-A menetapkan daftar putih untuk mengambil hanya jenis file tertentu. String dan pola diterima, dan keduanya dapat digunakan dalam daftar yang dipisahkan koma (seperti yang terlihat di atas). Lihat Jenis File untuk informasi lebih lanjut.

Menyalin file gambar dari folder Anda

Saya perhatikan bahwa situs web menggunakan file gambar PNG. Anda bisa menyalinnya dari folder Anda. Ini harus dijalankan di folder tempat Anda menyimpan halaman web.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
jangan
sumber
1

Wget hanya mengunduh file HTML halaman, bukan gambar di halaman, karena gambar dalam file HTML halaman tersebut ditulis sebagai URL. Untuk melakukan apa yang Anda inginkan, gunakan opsi -R(rekursif), -Aopsi dengan akhiran file gambar, --no-parentopsi, untuk membuatnya tidak naik, dan --levelopsi dengan 1.

Secara khusus wget -R -A .jpg,.png,.gif --no-parent --level <url>

Bahkan lebih baik lagi, sebagian besar browser memiliki metode untuk menyimpan halaman untuk dilihat secara offline .

Ramchandra Apte
sumber