Menggunakan rel = kanonik dengan sindikasi

21

Saya bekerja di situs yang memungkinkan sindikasi konten (melalui API dan dump data). Kami menemukan bahwa sejumlah situs yang menerbitkan ulang konten kami muncul lebih tinggi di hasil pencarian Google, meskipun kami adalah penerbit asli. Ini membuat frustrasi.

Kami sedang mempertimbangkan untuk membuat rel=canonical bagian dari persyaratan atribusi kami. Google mengatakan itu sah untuk menggunakannya di seluruh domain, dan dalam skenario sindikasi.

Sudahkah Anda melakukan ini, dan apakah Google mempertimbangkan URL kanonik dalam peringkat pencarian? Apakah ini akan membantu kami mengurangi SERP "spam" seperti itu?

Matt Sherman
sumber
1
Apa yang Anda gambarkan bukanlah spam. Orang-orang melakukan apa yang Anda minta mereka lakukan - mensindikasikan konten Anda. Spam adalah iklan e-mail yang tidak diminta dan halaman web yang dibuat untuk tujuan membombardir orang dengan iklan alih-alih menciptakan sesuatu yang bernilai. Jika itu adalah jenis situs yang mensindikasikan konten Anda, maka Anda perlu memikirkan kembali model sindikasi Anda, atau itu akan berdampak buruk pada situs Anda (hanya melalui asosiasi). Tetapi menyederhanakan memiliki peringkat pencarian yang lebih baik daripada Anda tidak membuat spam situs.
Lèse majesté
@ Lèse benarkah? situs-situs ini tampaknya bertentangan langsung dengan aturan "konten asli sedikit atau tidak ada" yang dibuat oleh Google sendiri google.com/support/webmasters/bin/answer.py?answer=66361
Jeff Atwood
@ Jeff: Situs mana yang secara spesifik Anda maksud? Saya berbicara tentang tindakan menggunakan sindikasi web itu sendiri, yang merupakan sesuatu yang dilakukan oleh banyak situs yang sah. Situs spam tidak harus menggunakan konten sindikasi, dan hanya menggunakan konten sindikasi tidak menjadikan situs sebagai situs spam (bahkan jika mereka mencapai peringkat yang lebih baik daripada Anda). Contohnya, banyak publikasi berita utama menggunakan konten sindikasi dari AP untuk melengkapi konten mereka sendiri. Apakah itu duplikat konten? Iya nih. Tapi apakah itu spam? Tidak. Dan saya tidak berpikir AP juga mempromosikan spamming.
Lèse majesté
@Lèse kata kunci di sini adalah melengkapi konten mereka sendiri . Jika SEMUA konten disalin, apa nilai atau minat sedang dibuat, tepatnya?
Jeff Atwood
1
@ Jeff: Tidak jelas dari pertanyaan Matt bahwa itu adalah situs yang dia maksud. Dia hanya menyatakan bahwa ada situs yang menerbitkan ulang kontennya (yang merupakan tujuan menyediakan API sindikasi) yang peringkatnya lebih tinggi dari konten aslinya. Bagi saya, itu tidak menyiratkan bahwa ini adalah situs spam. Tapi mungkin interpretasi saya terhadap pertanyaan itu salah.
Lèse majesté

Jawaban:

10

Jeff 100% benar dalam semua yang dikatakannya.

Masalah lain dengan meminta situs sindikasi untuk digunakan <link rel="canonical" href="http://example.com/foo">adalah bahwa ia memberi tahu Google bahwa halaman sindikasi tidak mendapatkan Page Rank dan http://example.com/foosebaliknya harus mendapatkan semuanya.

Itu menciptakan dua masalah utama.

  1. Halaman sindikasi tidak akan muncul sama sekali di pencarian Google karena tidak memiliki peringkat halaman. Situs sindikasi tidak akan sedikit senang tentang ini. Membuatnya tidak mungkin bahwa mereka akan bersedia melakukan perubahan jika mereka bisa.
  2. Ini mungkin tidak memengaruhi situs Anda seperti yang Anda inginkan karena Anda secara efektif tidak ditautkan dari situs Sindikasi. Saya ingin tahu bagaimana Google akan menangani ini. Memang benar mereka mengizinkan cross site rel = "canonical" tetapi saya percaya tujuan dari itu adalah untuk migrasi situs dan untuk memiliki beberapa situs di bawah satu host dengan konten yang sama untuk memiliki satu halaman defacto versus sekelompok halaman yang sama / sama.
Ben Hoffman
sumber
Itulah beberapa poin bagus. Saya pikir sindikasi adalah satu bidang di mana ada alasan yang sah untuk adanya duplikat konten. Dalam hal ini, lebih baik meninggalkan konten duplikat sendirian dan menerima bahwa itulah sindikasi itu. Tentu saja, idealnya Google harus memberikan preferensi ke halaman asli daripada halaman mitra sindikasi. Mungkin tag baru perlu dibuat yang merupakan sesuatu di antara rel="canonical"dan <cite>tag HTML5 . Dengan begitu mesin pencari dapat mengetahui halaman mana yang asli untuk konten duplikat yang sah.
Lèse majesté
dikonfirmasi, lihat tanggapan saya dari Matt Cutts di bawah ini.
Jeff Atwood
14

Penelitian saya menunjukkan bahwa memerlukan tautan balik - dan tautan tersebut TIDAK diikuti - sejauh ini adalah kriteria yang paling penting.

Jika situs "sindikat" tidak mengaitkan konten dengan tautan kembali ke sumber asli yang valid untuk diikuti oleh mesin telusur, mesin telusur memiliki waktu yang jauh lebih sulit untuk melacak asal konten tersebut, dan harus menerapkan "temukan duplikat konten teks kompleks di seluruh seluruh internet "heuristik.

Saya tidak yakin lagi bahwa itu perlu.

Video terkait Matt Cutts

http://www.youtube.com/watch?v=x8XdFb6LGtM

Matt mengatakan bahwa akan lebih baik menggunakan rel = "canonical" untuk menunjuk kembali ke halaman di mana artikel itu berasal - sama seperti ia sering menyarankan bahwa artikel sindikasi termasuk tautan konvensional (mis. <a>Tag nchor) yang menunjuk kembali ke artikel asli.

Ingatlah bahwa kanonik tidak hanya menampar rel="canonical" pada <a>tag; lebih seperti ini:

<html>
    <head>
         <link rel="canonical" href="http://example.com/foo">
    </head>
...

Jadi itu membutuhkan jenis pekerjaan yang berbeda, Anda harus memodifikasi setiap header halaman. Saya tidak yakin banyak dari "sindikator" ini akan memiliki tingkat kendali versus tautan sederhana ( tanpa nofollow!) Kembali ke sumbernya.

Jeff Atwood
sumber
Saya juga menyarankan membaca entri blog Jeff tentang topik ini, Membutuhkan Atribusi yang Dibutuhkan - blog.stackoverflow.com/2010/08/defending-attribution-required
Scott Mitchell
@scott perhatikan bahwa awalnya kami tidak memerlukan tautan yang diikuti, tetapi kami mengubahnya karena laba-laba Google kehilangan barang-barang yang ada di data kami, dibuang oleh beberapa pengikis ... dan tautan yang hilang yang tidak diikuti tidak membantu mengembalikannya dalam indeks Google!
Jeff Atwood
@ Jeff: Sedikit menyinggung, satu hal yang telah mengganggu saya adalah bahwa tautan dalam jawaban Stackoverflow memiliki rel = "nofollow". Bukankah seharusnya pengguna dengan perwakilan tertentu mendapat manfaat dari no rel = "nofollow" ke tautan yang mereka posting?
Scott Mitchell
@scott bidang situs web di profil Anda, di semua situs web Stack Exchange memiliki nofollow dihapus di perwakilan 2k sebagai rasa hormat.
Jeff Atwood
1
@ Jeff, saya berbicara tentang tautan dalam jawaban Stackoverflow. Misalnya, jika saya melakukan view / source pada halaman ini, saya melihat tautan dalam jawaban Anda (seperti yang ada di YouTube) memiliki rel = "nofollow". Saya kira ini untuk mencegah spammer tetapi pada saat yang sama sepertinya Anda kehilangan kesempatan untuk meningkatkan relevansi hasil pencarian untuk orang lain, belum lagi tidak "memberi kredit" (di mata Google) kepada orang yang menulis entri artikel / blog / dll. yang ditautkan ke.
Scott Mitchell
2

Menambahkan jawaban lain karena saya mendapat tanggapan pasti dari Matt Cutts mengenai ini:

rel=canonicalberfungsi di seluruh domain, tetapi pada dasarnya berfungsi seperti 301 [redirect] , sehingga halaman situs target akan langsung menuju ke situs Anda di Google. Setiap situs yang menggunakan konten Anda pada dasarnya akan dihapus dari mesin pencari.

Seperti yang Matt katakan, cara terbaik untuk berpikir rel=canonicaladalah sebagai pengalihan permanen 301 .

Dengan demikian, memerlukan lintas domain rel=canonicalsebagai satu set istilah atribusi akan seperti meminta mereka untuk mengalihkan ke Anda! Aduh. : P

Mengetahui hal ini, jelas bahwa rel=canonicalini dimaksudkan hanya untuk digunakan di situs yang secara pribadi Anda kendalikan - seperti ketika Anda memindahkan domain dan Anda memerlukan satu konten domain untuk menggantikan yang lain.

Jeff Atwood
sumber