Di Alat Webmaster Google, saya perhatikan bahwa halaman depan saya diindeks dua kali:
example.com/
example.com/?chocaid=397
Saya tahu bahwa saya dapat memperbaikinya dengan menggunakan tipe tautan canonical
, tetapi saya bertanya-tanya: Dari mana parameter ini berasal?
Ada berbagai situs yang memiliki halaman yang diindeks dengan parameter / nilai ini: https://duckduckgo.com/?q=chocaid%3D397 .
Saya mencari kesamaan antara situs-situs ini. tetapi tidak dapat menemukan yang konklusif: Ini sering menjadi halaman depan, tetapi tidak dalam setiap kasus. Beberapa NSFW, tetapi tidak semua. Ketika URL satu domain memiliki parameter ini, seringkali subdomain lain dari domain yang sama juga memilikinya.
Contohnya
Entri Wikipedia
Microsoft Codeplex
url
url-parameters
unor
sumber
sumber
?chocaid=397
mendapatkan diindeks maka mungkin ada sesuatu yang menghubungkannya untuk Google untuk menemukan tautan di tempat pertama??chocaid=397
bisa jadi semacam upaya untuk mengacaukan hash (saya tidak tahu banyak tentang ini, jadi saya tidak yakin tentang ini, meskipun). Juga, ini pertanyaan yang bagus.Jawaban:
Seberapa baru domain Anda? Sangat mungkin ini adalah permintaan populer di domain lama dan dengan demikian Anda masih mendapatkan "pengunjung". Apakah peta ini ke halaman yang valid atau 404? Jika Anda mendapatkan banyak hit di sana dan itu adalah 404, maka saya akan memetakannya kembali (gunakan .htaccess) ke beranda Anda atau sesuatu.
sumber
canonical
, tetapi pertanyaan ini lebih tentang asal dari parameter ini.Mungkin Googlebot mencoba mengakses jQuery / Javascript dan merayapi semua yang dia bisa. Ada posting terbaru di sini tentang seseorang yang meminta bantuan karena Googlebot merayapi URL yang tidak valid di situs mereka. John M menjawab tentang bagaimana Googlebot mencari lebih banyak URL untuk dirayapi dari skrip di situs mereka. Ia bekerja untuk Alat Webmaster Google. Anda cukup banyak menjawab pertanyaan Anda sendiri dengan mengatur tag kanonik.
sumber
Meskipun saya tidak memiliki jawaban yang pasti, ada beberapa hal yang saya temukan ketika melihat ini yang dapat membantu mempersempitnya:
Tebakan terbaik saya adalah ada beberapa situs scraper yang menambahkan URL ini ke semua tautan yang ditemukannya. Tentu saja, tautan eksternal nampaknya merupakan penjelasan yang paling mungkin dari mana asalnya, dan direktori tidak mungkin karena fakta itu sedang ditambahkan ke halaman yang cukup acak.
sumber
Ini mungkin berasal dari penyedia iklan yang mungkin Anda miliki, saya memiliki masalah yang sama dan satu-satunya tempat yang mungkin berasal dari penyedia adprovider menyuntikkan beberapa malware melalui kode javascript.
sumber