Apa itu duplikat konten dan bagaimana saya bisa tidak dihukum untuk itu di situs saya?

36

Ini adalah pertanyaan umum, komunitas wiki mengenai konten duplikat.

Jika pertanyaan Anda ditutup sebagai duplikat dari pertanyaan ini dan Anda merasa bahwa informasi yang diberikan di sini tidak memberikan jawaban yang memadai, silakan buka diskusi di Pro Webmaster Meta .


  1. Apa yang dianggap Google sebagai konten duplikat?
  2. Apakah cara saya menyajikan konten saya akan menghasilkan penalti duplikat konten?
  3. Bagaimana saya bisa menghindari konten situs saya diperlakukan sebagai konten duplikat?
danlefree
sumber

Jawaban:

31

Panduan webmaster Konten Duplikat Google mendefinisikan konten duplikat (untuk tujuan optimasi mesin pencari) sebagai "blok konten substantif di dalam atau di seluruh domain yang sama sekali cocok dengan konten lain atau sangat mirip".

Panduan Google berlanjut ke daftar berikut ini sebagai contoh konten duplikat:

  • Forum diskusi yang dapat menghasilkan halaman biasa dan strip-down yang ditargetkan pada perangkat seluler
  • Simpan item yang ditampilkan atau ditautkan melalui beberapa URL berbeda
  • Versi halaman web khusus printer

Hukuman

Mesin pencari perlu menghukum beberapa contoh duplikat konten yang dirancang untuk mengirim spam indeks pencarian mereka seperti:

  • situs scraper yang menyalin konten grosir
  • teknik pemintalan artikel sederhana yang menghasilkan konten "baru" dengan secara selektif mengganti kata dalam konten yang ada.

Ketika mesin pencari menemukan konten duplikat mereka dapat:

  • Menghukum seluruh situs yang berisi konten duplikat. (ketika spam)
  • Pilih halaman sebagai sumber kanonik konten dan turunkan prioritas atau tidak mengindeks halaman lain dengan duplikasi. (umum)
  • Jangan mengambil tindakan hukuman dan mengindeks beberapa salinan konten (jarang)

Menghindari duplikasi internal

Ketika ditanya tentang konten duplikat, Matt Cutts dari Google mengatakan bahwa itu hanya akan merugikan Anda jika terlihat spam , namun banyak webmaster menggunakan teknik berikut untuk menghindari duplikasi konten yang tidak perlu:

  • Pastikan bahwa konten hanya dapat diakses di bawah satu URL kanonik
  • Jika situs Anda harus mengembalikan konten yang sama di bawah beberapa URL (misalnya untuk halaman "tampilan cetak") tentukan URL kanonik secara manual dengan elemen tautan di header dokumen
  • Dalam kasus di mana situs Anda mengembalikan konten serupa berdasarkan parameter yang dikodekan dalam URL (misalnya mengurutkan katalog produk) mengecualikan parameter URL di Alat Webmaster Google

Sindikasi Konten

Menerbitkan konten di situs Anda yang telah dipublikasikan di tempat lain disebut sindikasi konten. Membuat duplikat konten melalui sindikasi konten bisa OK:

  • Selama Anda memiliki izin untuk melakukannya
  • Anda memberi tahu pengguna Anda apa isinya dan dari mana asalnya
  • Anda menautkan ke sumber asli (Tautan mendalam langsung ke konten asli dari halaman dengan salinan, bukan hanya tautan ke halaman beranda situs di mana sumber asli dapat ditemukan)
  • Pengguna Anda merasakan manfaatnya
  • Anda memiliki sesuatu untuk ditambahkan ke konten itu sehingga pengguna lebih suka menemukan konten itu di situs Anda daripada di tempat lain. (Komentar atau kritik misalnya.)
  • Anda juga memiliki cukup konten asli di situs Anda (setidaknya 50% asli, tetapi idealnya 80% asli)

Meskipun Google tidak menghukum setiap contoh konten duplikat, bahkan konten duplikat yang tidak dihukum mungkin tidak membantu Anda mendapatkan pengunjung:

  • Anda bersaing dengan semua salinan lain yang ada di luar sana
  • Google kemungkinan akan lebih memilih sumber asli konten dan salinan konten yang paling terkemuka.

Google akan menghukum konten duplikat yang diterbitkan di situs web Anda dari sumber lain jika:

  • Tampaknya tergores atau dicuri (terutama tanpa atribusi).
  • Pengguna tidak bereaksi dengan baik terhadapnya (terutama mengklik kembali ke Google setelah mengunjungi situs Anda.)
  • Ada begitu banyak salinan di luar sana sehingga tidak ada alasan untuk mengirim pengguna ke salinannya.
  • Salinan Anda bukan yang asli, paling terkemuka, atau paling dapat digunakan; dan tidak memiliki komentar atau kritik.
  • Situs Anda tidak memiliki cukup konten orisinal untuk menyeimbangkan semua konten yang diterbitkan ulang.
  • Anda menduplikasi halaman begitu sering di dalam situs Anda sendiri sehingga Googlebot kesulitan merayapi situs lengkap.

Internasionalisasi dan Penargetan Geografis

Pelokalan konten adalah salah satu bidang di mana duplikasi konten dapat bermanfaat bagi SEO. Tidak apa-apa untuk menerbitkan konten yang sama di situs yang ditargetkan di berbagai negara yang menggunakan bahasa yang sama. Misalnya Anda mungkin memiliki situs AS, situs Inggris, dan situs Australia, semuanya dengan konten yang sama.

Dengan situs untuk setiap negara, biasanya memungkinkan untuk memberi peringkat yang lebih baik bagi pengguna di negara itu. Selain itu, dimungkinkan untuk secara khusus melayani pengguna di setiap negara dengan perbedaan ejaan kecil, harga dalam mata uang negara, atau opsi pengiriman produk. Untuk informasi lebih lanjut tentang pengaturan situs web yang ditargetkan secara geografis, lihat Bagaimana cara menyusun struktur URL saya untuk SEO dan lokalisasi?

Berurusan dengan Pencakar Konten

Situs lain yang mencuri konten Anda dan menerbitkannya kembali tanpa izin terkadang dapat menyebabkan masalah duplikat konten untuk situs Anda. Mesin pencari bekerja keras untuk memastikan bahwa situs pengikis sulit untuk mendapat manfaat dari menggandakan konten Anda . Jika situs pengikis menyebabkan masalah bagi Anda, maka situs itu mungkin dihapus dari indeks Google dengan mengajukan permintaan DMCA dengan Google

Stephen Ostermiller
sumber
0

Secara sederhana, duplikat konten adalah konten yang disalin dari sumber web lain atau dari situs web Anda sendiri (konten yang sama di beberapa halaman).

Google dapat dengan mudah mengidentifikasi apakah itu adalah konten yang unik atau konten plagiarisme.

Lebih baik menulis konten sendiri untuk situs web dan juga tidak mengulangi konten yang sama di beberapa halaman.

Jika situs web Anda memiliki konten duplikat Anda tidak dapat berada di halaman pertama Google dan Anda akan dikenakan sanksi oleh pedoman Google dan terlebih lagi, Anda tidak akan berada di posisi 100 juga di SERP.

cstpl123
sumber
Duplikat tidak harus disalin dari sumber lain. Bisa juga di situs web Anda sendiri. Jika lebih dari satu URL dapat menyajikan konten yang sama, di mana pun ia berada, itu adalah duplikat konten.
John Conde