Adakah yang tahu bagaimana cara menyimpan halaman web dengan skrip dengan menggunakan wget? Atau parameter apa yang harus digunakan untuk mencapai?
Halaman web berisi skrip dan sepertinya hanya ekstensi SingleFile Core di Chrome yang dapat menyimpan semua properti konten. Firefox tidak dapat menyimpan konten tabel dan penyimpanan bawaan Chrome akan macet menampilkan pesan 'harap tunggu' untuk halaman hasil.
Bagian-bagian lain pada halaman tidak penting, hanya isi di dalam tabel, jadi saya memutuskan untuk menemukan cara untuk melakukan itu tetapi menghabiskan satu jam untuk menganalisis kode sumber dan melihat informasi dari alat pengembang f12 tetapi tidak bisa cara untuk menyimpan isi tabel saja.
Berikut adalah halaman web: http://m.marine.gov.mo/seawayScheduled/RealTimeSailing.aspx?type=dataDepartureXML&local=PE&lang=ENG
Terima kasih untuk bantuannya!
Jawaban:
Dan jawabannya adalah:
Di mana bit 'ASP.NET ....' adalah cookie yang sayangnya wajib. Cookie ini dikirim ketika Anda mengambil halaman utama. Jadi Anda harus melakukannya sedikit berbeda dengan dua perintah:
salah satu yang mendapatkan halaman utama dan membuangnya (tetapi menyimpan cookie di cookie.txt):
salah satu yang mendapatkan data, mengirimkan cookie:
Data yang Anda dapatkan adalah array JSON dengan dua elemen string, yang merupakan HTML mentah. Karakter khusus (tanda kutip, kurung ....) diloloskan sehingga hasilnya tidak terlalu mudah dibaca, sedikit tidak sulit untuk dibersihkan dengan beberapa perubahan global dalam editor.
sumber