Bagaimana cara mengatasi tajuk 'modifikasi terakhir' yang hilang?

13

Saya berlari wgetseperti ini:

wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main

Saya mendapat banyak pesan ini:

Last-modified header missing -- time-stamps turned off.

Saya kira itu berarti bahwa halaman-halaman terus diunduh ulang, meskipun saya memilikinya secara lokal.

CATATAN : Saya ingin ini sehingga saya tidak perlu mengunduh ulang file yang ada setiap kali saya menjalankan mirror perintah.

tepang
sumber
Apakah Anda pemilik halaman (jika benar-benar tshepang.net). Jika demikian, apakah server web apache dan apakah Anda memiliki kendali atas konfigurasinya? Atau setidaknya apakah .htaccess diaktifkan dengan opsi override diizinkan?
forcefsck
@ Forcefsck: Tidak, situs ini dijalankan oleh Posterous. Mereka memiliki API untuk membaca semua posting, tapi ini kurva belajar bagi saya teknologi web ini.
tshepang

Jawaban:

10

Apakah Anda mencoba menambahkan -cparameter?

Kutipan dari wget manual:

-c --lanjutkan

Dimulai dengan Wget 1.7, jika Anda menggunakan -c pada file yang tidak kosong, dan ternyata server tidak mendukung pengunduhan lanjutan, Wget akan menolak untuk memulai pengunduhan dari awal, yang secara efektif akan merusak konten yang ada. Jika Anda benar-benar ingin unduhan dimulai dari awal, hapus file tersebut.

Juga dimulai dengan Wget 1.7, jika Anda menggunakan -c pada file dengan ukuran yang sama dengan yang ada di server, Wget akan menolak untuk mengunduh file dan mencetak pesan penjelasan. Hal yang sama terjadi ketika file lebih kecil di server daripada lokal (mungkin karena itu diubah pada server sejak upaya unduhan terakhir Anda) --- karena '' melanjutkan '' tidak berarti, tidak ada unduhan terjadi.

Di sisi lain dari koin, saat menggunakan -c, file apa pun yang lebih besar di server daripada lokal akan dianggap sebagai unduhan yang tidak lengkap dan hanya "(panjang (jarak jauh) - panjang (lokal))" byte akan diunduh dan ditempelkan ke akhir file lokal. Perilaku ini dapat diinginkan dalam kasus-kasus tertentu --- misalnya, Anda dapat menggunakan wget -c untuk mengunduh hanya bagian baru yang telah ditambahkan ke kumpulan data atau file log.

Sepengetahuan saya ini harus melewati file yang sudah diunduh dan berukuran sama.

Shinnok
sumber
Bagaimana jika file tersebut lebih kecil?
CJ7