Dari mana parameter URL “? Chocaid = 397” berasal?

9

Di Alat Webmaster Google, saya perhatikan bahwa halaman depan saya diindeks dua kali:

  • example.com/
  • example.com/?chocaid=397

Saya tahu bahwa saya dapat memperbaikinya dengan menggunakan tipe tautan canonical, tetapi saya bertanya-tanya: Dari mana parameter ini berasal?

Ada berbagai situs yang memiliki halaman yang diindeks dengan parameter / nilai ini: https://duckduckgo.com/?q=chocaid%3D397 .

Saya mencari kesamaan antara situs-situs ini. tetapi tidak dapat menemukan yang konklusif: Ini sering menjadi halaman depan, tetapi tidak dalam setiap kasus. Beberapa NSFW, tetapi tidak semua. Ketika URL satu domain memiliki parameter ini, seringkali subdomain lain dari domain yang sama juga memilikinya.

Contohnya

Entri Wikipedia

masukkan deskripsi gambar di sini

Microsoft Codeplex

masukkan deskripsi gambar di sini

unor
sumber
Di Alat Webmaster Google (atau log referer Anda) apakah ada indikasi halaman mana yang mungkin terhubung ke URL ini?
MrWhite
@ w3d: Saya tidak memiliki akses ke log apa pun. Di GWT, itu tercantum dalam " Perbaikan HTML " → "judul halaman yang diulang". Jadi saya khawatir saya tidak bisa mendapatkan informasi pengarah.
unor
Saya hanya ingin tahu apakah ada sesuatu di bawah Traffic> Tautan ke Situs Anda> Konten Anda yang paling banyak ditautkan> Lainnya (untuk mendapatkan semua halaman yang ditautkan). Untuk ?chocaid=397mendapatkan diindeks maka mungkin ada sesuatu yang menghubungkannya untuk Google untuk menemukan tautan di tempat pertama?
MrWhite
@ w3d: Ah, begitu. Sayangnya, data masih hilang untuk laporan ini (mungkin karena saya menggunakan GWT hanya untuk beberapa hari).
unor
Tidak yakin apakah ini membantu, tetapi angka 397 ada hubungannya dengan hash (lihat di sini dan di sini ). Saya tidak yakin apakah ini ada hubungannya dengan pertanyaan ini, tetapi ?chocaid=397bisa jadi semacam upaya untuk mengacaukan hash (saya tidak tahu banyak tentang ini, jadi saya tidak yakin tentang ini, meskipun). Juga, ini pertanyaan yang bagus.

Jawaban:

1

Seberapa baru domain Anda? Sangat mungkin ini adalah permintaan populer di domain lama dan dengan demikian Anda masih mendapatkan "pengunjung". Apakah peta ini ke halaman yang valid atau 404? Jika Anda mendapatkan banyak hit di sana dan itu adalah 404, maka saya akan memetakannya kembali (gunakan .htaccess) ke beranda Anda atau sesuatu.

Kyros
sumber
1
Saya belum melihat ada pengunjung; Saya melihat halaman diindeks oleh Google. Ini peta ke halaman depan yang sama (seolah-olah parameter dihilangkan). Saya tahu bahwa saya bisa mengarahkan ulang atau menggunakannya canonical, tetapi pertanyaan ini lebih tentang asal dari parameter ini.
unor
2
Tetapi ini tidak menjelaskan mengapa parameter URL yang sama muncul di hasil pencarian untuk banyak domain lain.
MrWhite
1

Mungkin Googlebot mencoba mengakses jQuery / Javascript dan merayapi semua yang dia bisa. Ada posting terbaru di sini tentang seseorang yang meminta bantuan karena Googlebot merayapi URL yang tidak valid di situs mereka. John M menjawab tentang bagaimana Googlebot mencari lebih banyak URL untuk dirayapi dari skrip di situs mereka. Ia bekerja untuk Alat Webmaster Google. Anda cukup banyak menjawab pertanyaan Anda sendiri dengan mengatur tag kanonik.

Anagio
sumber
1

Meskipun saya tidak memiliki jawaban yang pasti, ada beberapa hal yang saya temukan ketika melihat ini yang dapat membantu mempersempitnya:

  • Tautan juga muncul di Bing dan Yahoo, jadi tidak ada hubungannya dengan Google.
  • Mereka muncul di wiki, blog Tumblr, blog Wordpress, dan situs lainnya, sehingga mereka tidak akan ditambahkan melalui exploit dalam perangkat lunak tertentu.
  • Mereka muncul di beberapa situs Tumblr yang berkualitas sangat rendah, dan karenanya tidak mungkin ada iklan di sana. Demikian juga, artikel wikipedia tidak mungkin dipromosikan melalui iklan.

Tebakan terbaik saya adalah ada beberapa situs scraper yang menambahkan URL ini ke semua tautan yang ditemukannya. Tentu saja, tautan eksternal nampaknya merupakan penjelasan yang paling mungkin dari mana asalnya, dan direktori tidak mungkin karena fakta itu sedang ditambahkan ke halaman yang cukup acak.

RichardB
sumber
0

Ini mungkin berasal dari penyedia iklan yang mungkin Anda miliki, saya memiliki masalah yang sama dan satu-satunya tempat yang mungkin berasal dari penyedia adprovider menyuntikkan beberapa malware melalui kode javascript.

Raymund
sumber
Apakah Anda memiliki sumber / bukti untuk ini? Ini berarti bahwa Wikipedia terinfeksi oleh ini, karena ada beberapa halaman Wikipedia diindeks dengan parameter ini.
unor
Ya karena saya punya blog yang diblokir Google karena ini dan setelah menghapus iklan pelakunya mereka mulai menghapus blokir
Raymund