Saya mencoba membantu kolega di Macbook Air MacOsx 10.11.06 dengan mengarsipkan situs web menggunakan wget (versi 1.19.1) diinstal melalui minuman. Menggunakan perintah ini.
wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=windows --domain scart.be --warc-file=20161103_scart www.scart.be
Namun ini menghasilkan kesalahan di terminal:
Konversi tautan di http://www.scart.be/index.html?q=fr%2Fnode%2F1135.html 35-27 Terjadi rangkaian multibyte yang tidak lengkap atau tidak valid.
Saya mengujinya dan bekerja dengan baik pada mesin xenial Ubuntu (wget versi 1.17.1) dan pada sistem lain, MacOsx 10.11.06. (wget versi 1.19.1)
Saya telah mencoba mengubah "--restrict-file-names = windows" menjadi "--restrict-file-names = nocontrol", tidak ada yang berubah. Jika kami mencoba mengimpor file .warc ke Webrecorder-player, ia menampilkan "tidak ada bookmark yang ditemukan" di mana ia bekerja dengan file .warc yang dibuat pada dua mesin lain yang disebutkan sebelumnya. Apa yang saya temukan sejauh ini di situs lain, adalah bahwa kesalahan ini terkait dengan pengkodean karakter dan telah terjebak di sana.
sumber