Saat menjelajahi bagian "Kesalahan Perayapan" Alat Google Webmaster, saya menemukan serangkaian 500 kesalahan yang sangat aneh sehubungan dengan situs saya:
Saya dapat melacak apa karakter-karakter ini, dan ternyata mereka adalah dua karakter pertama di Area Penggunaan Pribadi Unicode . Font saya kebetulan memetakan mereka ke katak mengenakan mahkota kecil, dan simbol yang menyerupai angka 7.
Simbol-simbol ini hanya muncul di alamat file non-HTML; dokumen kantor, PDF, dll. - tetapi tidak hanya muncul dalam nama file.
Di mana simbol-simbol ini berasal, dan apakah ada cara saya dapat menghilangkannya sehingga Google dapat merayapi situs saya dengan benar?
Beberapa informasi latar belakang:
- Menggunakan Web Server yang menjalankan WS2K3 dengan IIS6 dan PHP 5.3.8
- Pengkodean situs adalah UTF-8
- Simbol-simbol ini tidak muncul di halaman, atau di sumber
google-search-console
http-code-500
unicode
Jacob Hume
sumber
sumber
Jawaban:
Ini hanya dugaan, tetapi satu kemungkinan adalah orang lain melakukan hotlink ke file Anda dengan beberapa kode yang rusak. Saya tahu bahwa setiap kali saya memiliki permintaan yang cerdik ke situs saya, saya selalu dapat melacaknya ke tautan yang dicuri orang lain. (Ini sangat menjengkelkan bahwa spider tidak menyertakan header Http-Referer untuk memudahkan kita mengidentifikasi sumber URL ini).
sumber