Mengapa Google mengindeks halaman dengan? Utm_campaign string query

9

Baru-baru ini saya perhatikan bahwa Google mengindeks URL yang berisi utm_campaign, utm_source, dan utm_medium argumen string kueri. Dalam hasil, Google menunjukkan URL dengan string kueri ini daripada URL kanonik:

utm_campaign ditambahkan ke URL

Saya mengerti ini bisa menjadi masalah 'duplikat konten', tetapi saya telah menggunakan link rel=canonicaltag di seluruh situs web saya. Sebagai satu contoh:

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

Cuplikan layar dari tag kanonik

Harapan saya adalah bahwa Google harus menggunakan URL kanonik untuk pengindeksan. Apa yang saya lakukan salah?

Brendon
sumber
2
Bahkan tanpa tag kanonik, Googlebot biasanya mengabaikan parameter UTM karena tahu parameter itu hanya digunakan untuk pelacakan. Saya belum pernah melihat mereka diindeks sebelumnya, terutama dengan kanonik.
Stephen Ostermiller
4
FWIW site:stackexchange.com inurl:utm_campaignjuga mengembalikan hasil yang serupa (pada skala yang sedikit lebih besar). Perhatikan juga bahwa site:pencarian sering menghasilkan URL non-kanonik dalam hasil, yang biasanya tidak dikembalikan dalam pencarian "normal". Namun, URL di atas juga tampaknya dikembalikan dalam pencarian "normal".
MrWhite

Jawaban:

3

Meninjau situs web Anda seperti sekarang, saya tidak terlalu yakin apakah ini masalah lagi / saat ini.

Masalahnya bukan hubungan internal di situs web Anda dengan penyertaan parameter UTM (seperti yang disarankan pertanyaan lain).

Sepertinya lebih seperti beberapa proses Anda harus berbagi konten situs web Anda di media sosial meninggalkan parameter UTM di URL dan berbagi URL yang, pada beberapa titik, menyebabkan mereka diindeks.

Jarang terjadi, tetapi telah terjadi pada banyak situs lain sebelumnya. Fakta bahwa hanya tiga halaman yang diindeks dengan parameter-parameter ini menunjukkan bahwa ini bukan masalah yang serius atau masalah keseluruhan.

Berikut adalah langkah-langkah yang dapat Anda ambil untuk membantu memberantas ini terjadi: -

1. Tentukan URL kanonik di halaman Anda

Anda sudah melakukan ini dan implementasinya benar. Ini akan memastikan hanya URL kanonik yang ditentukan yang akan diberi bobot di mesin pencari. Agaknya ini selalu ada tetapi jika tidak, maka ini bisa menjelaskan mengapa ada beberapa contoh halaman lama masih diindeks dengan parameter UTM.

Implementasi URL kanonik yang benar

2. Perintahkan Google untuk tidak mengindeks parameter UTM di Search Console

Jika beberapa URL diindeks dengan parameter UTM (seperti kasus Anda), parameter URL akan muncul sebagai yang terdeteksi dari dalam bagian 'Perayapan> Parameter URL' dari Google Search Console untuk domain Anda (lihat di bawah).

Parameter Parameter Konsol URL Pencarian Google

Bahkan jika parameter UTM tidak muncul, Anda dapat 'Tambahkan Parameter' untuk membuatnya.

Cukup pilih No: Doesn't affect page content (ex: tracks usage)(dikenal sebagai 'Parameter Pasif') dan Google kemudian biasanya hanya akan merangkak hanya satu URL dengan nilai parameter tertentu .

3 Larang parameter URL di robots.txt Anda

Ini akan memblokir Google dari pengindeksan konten URL ini tetapi bukan URL yang sebenarnya itu sendiri (mereka masih bisa ditampilkan dalam hasil pencarian tetapi hanya akan menghilangkan deskripsi seperti di bawah ini).

Halaman yang diindeks dilarang di robots.txt

Cukup menambahkan sesuatu seperti yang berikut ini akan menangani ini dari robots.txt: -

Disallow: /*?utm=*

Kesimpulan

Langkah # 1 dan # 2 harus dilakukan sebagai tindakan pencegahan dan "praktik terbaik" bagaimanapun juga dan langkah # 3 sebagai tambahan untuk langkah # 1 dan # 2 mungkin (karena tidak akan efektif sendiri).

Di dalam Google Search Console, ada juga kemampuan untuk (sementara) menghapus URL. Ini sangat berguna jika ada beberapa halaman yang keras kepala masih diindeks tetapi Anda tahu sumber akar masalah telah diselesaikan dan fasilitas ini harus cukup untuk menghilangkannya sekali dan untuk semua dari hasil pencarian.

Saya belum memasukkan ini sebagai langkah di atas karena, meskipun telah meneliti ini sebelumnya, saya tidak dapat mengingat apakah ini akan mendukung URL dengan parameter [rujukan?]. Saya pernah tahu jawabannya tetapi ingatan saya mengecewakan saya pada kesempatan khusus ini.

Lebih banyak membaca tentang penghapusan URL dari Google .

zigojacko
sumber
1
Tetapi jika Anda memblokir URL-URL ini agar tidak dirayapi menggunakan robots.txt(# 3) maka bukankah Anda juga akan memblokir kampanye-kampanye ini agar tidak dilacak ? ... Dan juga mencegah agar tag kanonik dalam halaman tidak dibaca (# 1)?
MrWhite
Saya setuju dengan apa yang dikatakan w3dk tentang robots.txt. Jika ada gunakan noindex: /*?utm=*di robots.txt.
Stephen Ostermiller
2

Tampaknya Anda menggunakan tautan ini di dalam konten situs web Anda untuk menghubungkan halaman bersama.

Untuk memastikan Google tidak akan mengindeks, Anda dapat menambahkan rel="nofollow"tautan ini di dalam situs web Anda dan memblokir params ini dari file robots.txt:

Disallow : /*utm_campaign
Nadeem Haddadeen
sumber
Bagus menangkap bahwa mereka digunakan untuk tautan internal. Itu akan menjelaskan perbedaan dari sebagian besar situs yang umumnya hanya digunakan pada tautan masuk.
Stephen Ostermiller
Sebenarnya URL utm_campaign ditambahkan oleh Buffer.com - mis., URL itu terlihat seperti "utm_source = plus.google.com & utm_campaign = buffer". Saya rasa saya tidak menggunakan tautan ini di situs web mana pun.
Brendon
1

Sudahkah Anda memeriksa apakah URL kanonik Anda telah diindeks atau tidak? Jika URL kanonik telah diindeks maka tidak ada yang perlu dikhawatirkan.

Anda dapat mencoba Alat Webmaster Google dan mengubah cara Google menangani parameter URL di sini .

muhammad usman
sumber
1
Untuk beberapa URL, hanya URL utm_campaign yang diindeks. Untuk halaman lain, kedua URL muncul di indeks. Kemarin, saya menggunakan alat Ambil sebagai Google untuk merayapi satu URL (dengan string permintaan utm_campaign) - URL itu sekarang tampaknya telah menghilang, dan URL kanonik sekarang diindeks.
Brendon
Juga, statistik perayapan ( tangkapan layar ) tampaknya menunjukkan halaman yang membutuhkan waktu lama untuk merayapi (rata-rata 2,3s). Saya tidak yakin apakah ini masalah yang tersebar luas, tetapi mungkin Google mengalami beberapa masalah saat merayapi situs.
Brendon
Anda juga dapat melakukan sedikit pembersihan begitu pengunjung mendarat di situs web Anda. Gunakan tautan Skrip URL segar untuk menghapus secara dinamis setiap parameter UTM dari URL setelah mendapatkan manfaat darinya. Kedua, tambahkan parameter URL ...
muhammad usman