Baru-baru ini saya perhatikan bahwa Google mengindeks URL yang berisi utm_campaign, utm_source, dan utm_medium argumen string kueri. Dalam hasil, Google menunjukkan URL dengan string kueri ini daripada URL kanonik:
Saya mengerti ini bisa menjadi masalah 'duplikat konten', tetapi saya telah menggunakan link rel=canonical
tag di seluruh situs web saya. Sebagai satu contoh:
[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]
Harapan saya adalah bahwa Google harus menggunakan URL kanonik untuk pengindeksan. Apa yang saya lakukan salah?
google
canonical-url
serps
Brendon
sumber
sumber
site:stackexchange.com inurl:utm_campaign
juga mengembalikan hasil yang serupa (pada skala yang sedikit lebih besar). Perhatikan juga bahwasite:
pencarian sering menghasilkan URL non-kanonik dalam hasil, yang biasanya tidak dikembalikan dalam pencarian "normal". Namun, URL di atas juga tampaknya dikembalikan dalam pencarian "normal".Jawaban:
Meninjau situs web Anda seperti sekarang, saya tidak terlalu yakin apakah ini masalah lagi / saat ini.
Masalahnya bukan hubungan internal di situs web Anda dengan penyertaan parameter UTM (seperti yang disarankan pertanyaan lain).
Sepertinya lebih seperti beberapa proses Anda harus berbagi konten situs web Anda di media sosial meninggalkan parameter UTM di URL dan berbagi URL yang, pada beberapa titik, menyebabkan mereka diindeks.
Jarang terjadi, tetapi telah terjadi pada banyak situs lain sebelumnya. Fakta bahwa hanya tiga halaman yang diindeks dengan parameter-parameter ini menunjukkan bahwa ini bukan masalah yang serius atau masalah keseluruhan.
Berikut adalah langkah-langkah yang dapat Anda ambil untuk membantu memberantas ini terjadi: -
1. Tentukan URL kanonik di halaman Anda
Anda sudah melakukan ini dan implementasinya benar. Ini akan memastikan hanya URL kanonik yang ditentukan yang akan diberi bobot di mesin pencari. Agaknya ini selalu ada tetapi jika tidak, maka ini bisa menjelaskan mengapa ada beberapa contoh halaman lama masih diindeks dengan parameter UTM.
2. Perintahkan Google untuk tidak mengindeks parameter UTM di Search Console
Jika beberapa URL diindeks dengan parameter UTM (seperti kasus Anda), parameter URL akan muncul sebagai yang terdeteksi dari dalam bagian 'Perayapan> Parameter URL' dari Google Search Console untuk domain Anda (lihat di bawah).
Bahkan jika parameter UTM tidak muncul, Anda dapat 'Tambahkan Parameter' untuk membuatnya.
Cukup pilih
No: Doesn't affect page content (ex: tracks usage)
(dikenal sebagai 'Parameter Pasif') dan Google kemudian biasanya hanya akan merangkak hanya satu URL dengan nilai parameter tertentu .3 Larang parameter URL di robots.txt Anda
Ini akan memblokir Google dari pengindeksan konten URL ini tetapi bukan URL yang sebenarnya itu sendiri (mereka masih bisa ditampilkan dalam hasil pencarian tetapi hanya akan menghilangkan deskripsi seperti di bawah ini).
Cukup menambahkan sesuatu seperti yang berikut ini akan menangani ini dari
robots.txt
: -Kesimpulan
Langkah # 1 dan # 2 harus dilakukan sebagai tindakan pencegahan dan "praktik terbaik" bagaimanapun juga dan langkah # 3 sebagai tambahan untuk langkah # 1 dan # 2 mungkin (karena tidak akan efektif sendiri).
Di dalam Google Search Console, ada juga kemampuan untuk (sementara) menghapus URL. Ini sangat berguna jika ada beberapa halaman yang keras kepala masih diindeks tetapi Anda tahu sumber akar masalah telah diselesaikan dan fasilitas ini harus cukup untuk menghilangkannya sekali dan untuk semua dari hasil pencarian.
Saya belum memasukkan ini sebagai langkah di atas karena, meskipun telah meneliti ini sebelumnya, saya tidak dapat mengingat apakah ini akan mendukung URL dengan parameter [rujukan?]. Saya pernah tahu jawabannya tetapi ingatan saya mengecewakan saya pada kesempatan khusus ini.
Lebih banyak membaca tentang penghapusan URL dari Google .
sumber
robots.txt
(# 3) maka bukankah Anda juga akan memblokir kampanye-kampanye ini agar tidak dilacak ? ... Dan juga mencegah agar tag kanonik dalam halaman tidak dibaca (# 1)?noindex: /*?utm=*
di robots.txt.Tampaknya Anda menggunakan tautan ini di dalam konten situs web Anda untuk menghubungkan halaman bersama.
Untuk memastikan Google tidak akan mengindeks, Anda dapat menambahkan
rel="nofollow"
tautan ini di dalam situs web Anda dan memblokir params ini dari file robots.txt:sumber
Sudahkah Anda memeriksa apakah URL kanonik Anda telah diindeks atau tidak? Jika URL kanonik telah diindeks maka tidak ada yang perlu dikhawatirkan.
Anda dapat mencoba Alat Webmaster Google dan mengubah cara Google menangani parameter URL di sini .
sumber