Saya mencoba mengunduh URL yang seperti itu http://www.somesite.com/restaurants.html#photo=22x00085
.
Saya meletakkannya di antara tanda kutip tunggal, tetapi hanya mengunduh http://www.somesite.com/restaurants.html yang bukan halaman yang benar.
Apakah ada solusinya?
Jawaban:
wget
bekerja dengan baik. The URI sintaks menetapkan bahwa fragmen - yang#foo
bagian - harus ditafsirkan seluruhnya sisi klien, dan tidak digunakan ketika mengambil dokumen itu sendiri.Misalnya, jika itu adalah laman HTML, peramban mungkin gulir ke bawah ke bagian bernama, atau - dalam kasus Anda - memicu beberapa kode JavaScript yang menunjukkan foto tertentu.
Dengan kata lain, sejauh
wget
menyangkut, URIhttp://www.somesite.com/restaurants.html#photo=22x00085
danhttp://www.somesite.com/restaurants.html
... arahkan ke halaman yang sama
/restaurants.html
. Terserah browser Anda untuk melakukan sisanya. Pembukaanrestaurants.html#photo=22x00085
di browser akan berfungsi dengan baik.sumber
Tanpa mengunjungi tautan yang tepat, saya tidak tahu yang mana, tetapi hanya ada dua opsi:
Hash sebenarnya merupakan bagian dari nama dokumen yang diminta. Dalam hal ini, Anda dapat menyandikannya:
Dalam kasus lain, dalam keadaan normal, http://www.somesite.com/restaurants.html dan http://www.somesite.com/restaurants.html#photo=22x00085 harus mengarah ke halaman yang sama. Bagian setelah hash hanya menunjukkan jangkar browser harus gulir ke setelah memuat halaman; bahkan tidak bisa dikirim ke server.
Namun, adalah mungkin, bahwa hash (ab) digunakan untuk memuat foto tertentu dengan JavaScript. Wget tidak dapat mengartikan JavaScript, jadi tidak ada yang dapat Anda lakukan tentang itu.
sumber
Itu bukan URL untuk gambar. URL untuk halaman yang menggunakan skrip atau kode lain untuk mengambil gambar. Coba muat halaman dengan JavaScript dimatikan. Itulah yang wget ambilkan untukmu.
Untuk menemukan URL untuk gambar, coba kunjungi halaman melalui browser Anda dan kemudian klik kanan pada foto. Seharusnya ada opsi untuk melihat informasi tentang gambar, termasuk URL-nya.
Jika itu tidak berhasil, mungkin karena gambar sedang dimuat melalui Flash atau program sisi klien lainnya. Anda dapat menggunakan Fiddler atau Wireshark untuk melihat URL apa yang dimuatnya.
Jika Anda memberi kami URL situs yang sebenarnya dengan gambar, kami dapat membantu Anda menentukan bagaimana gambar tersebut dimuat.
sumber