Panduan webmaster Konten Duplikat Google mendefinisikan konten duplikat (untuk tujuan optimasi mesin pencari) sebagai "blok konten substantif di dalam atau di seluruh domain yang sama sekali cocok dengan konten lain atau sangat mirip".
Panduan Google berlanjut ke daftar berikut ini sebagai contoh konten duplikat:
- Forum diskusi yang dapat menghasilkan halaman biasa dan strip-down yang ditargetkan pada perangkat seluler
- Simpan item yang ditampilkan atau ditautkan melalui beberapa URL berbeda
- Versi halaman web khusus printer
Hukuman
Mesin pencari perlu menghukum beberapa contoh duplikat konten yang dirancang untuk mengirim spam indeks pencarian mereka seperti:
- situs scraper yang menyalin konten grosir
- teknik pemintalan artikel sederhana yang menghasilkan konten "baru" dengan secara selektif mengganti kata dalam konten yang ada.
Ketika mesin pencari menemukan konten duplikat mereka dapat:
- Menghukum seluruh situs yang berisi konten duplikat. (ketika spam)
- Pilih halaman sebagai sumber kanonik konten dan turunkan prioritas atau tidak mengindeks halaman lain dengan duplikasi. (umum)
- Jangan mengambil tindakan hukuman dan mengindeks beberapa salinan konten (jarang)
Menghindari duplikasi internal
Ketika ditanya tentang konten duplikat, Matt Cutts dari Google mengatakan bahwa itu hanya akan merugikan Anda jika terlihat spam , namun banyak webmaster menggunakan teknik berikut untuk menghindari duplikasi konten yang tidak perlu:
- Pastikan bahwa konten hanya dapat diakses di bawah satu URL kanonik
- Jika situs Anda harus mengembalikan konten yang sama di bawah beberapa URL (misalnya untuk halaman "tampilan cetak") tentukan URL kanonik secara manual dengan elemen tautan di header dokumen
- Dalam kasus di mana situs Anda mengembalikan konten serupa berdasarkan parameter yang dikodekan dalam URL (misalnya mengurutkan katalog produk) mengecualikan parameter URL di Alat Webmaster Google
Sindikasi Konten
Menerbitkan konten di situs Anda yang telah dipublikasikan di tempat lain disebut sindikasi konten. Membuat duplikat konten melalui sindikasi konten bisa OK:
- Selama Anda memiliki izin untuk melakukannya
- Anda memberi tahu pengguna Anda apa isinya dan dari mana asalnya
- Anda menautkan ke sumber asli (Tautan mendalam langsung ke konten asli dari halaman dengan salinan, bukan hanya tautan ke halaman beranda situs di mana sumber asli dapat ditemukan)
- Pengguna Anda merasakan manfaatnya
- Anda memiliki sesuatu untuk ditambahkan ke konten itu sehingga pengguna lebih suka menemukan konten itu di situs Anda daripada di tempat lain. (Komentar atau kritik misalnya.)
- Anda juga memiliki cukup konten asli di situs Anda (setidaknya 50% asli, tetapi idealnya 80% asli)
Meskipun Google tidak menghukum setiap contoh konten duplikat, bahkan konten duplikat yang tidak dihukum mungkin tidak membantu Anda mendapatkan pengunjung:
- Anda bersaing dengan semua salinan lain yang ada di luar sana
- Google kemungkinan akan lebih memilih sumber asli konten dan salinan konten yang paling terkemuka.
Google akan menghukum konten duplikat yang diterbitkan di situs web Anda dari sumber lain jika:
- Tampaknya tergores atau dicuri (terutama tanpa atribusi).
- Pengguna tidak bereaksi dengan baik terhadapnya (terutama mengklik kembali ke Google setelah mengunjungi situs Anda.)
- Ada begitu banyak salinan di luar sana sehingga tidak ada alasan untuk mengirim pengguna ke salinannya.
- Salinan Anda bukan yang asli, paling terkemuka, atau paling dapat digunakan; dan tidak memiliki komentar atau kritik.
- Situs Anda tidak memiliki cukup konten orisinal untuk menyeimbangkan semua konten yang diterbitkan ulang.
- Anda menduplikasi halaman begitu sering di dalam situs Anda sendiri sehingga Googlebot kesulitan merayapi situs lengkap.
Internasionalisasi dan Penargetan Geografis
Pelokalan konten adalah salah satu bidang di mana duplikasi konten dapat bermanfaat bagi SEO. Tidak apa-apa untuk menerbitkan konten yang sama di situs yang ditargetkan di berbagai negara yang menggunakan bahasa yang sama. Misalnya Anda mungkin memiliki situs AS, situs Inggris, dan situs Australia, semuanya dengan konten yang sama.
Dengan situs untuk setiap negara, biasanya memungkinkan untuk memberi peringkat yang lebih baik bagi pengguna di negara itu. Selain itu, dimungkinkan untuk secara khusus melayani pengguna di setiap negara dengan perbedaan ejaan kecil, harga dalam mata uang negara, atau opsi pengiriman produk. Untuk informasi lebih lanjut tentang pengaturan situs web yang ditargetkan secara geografis, lihat Bagaimana cara menyusun struktur URL saya untuk SEO dan lokalisasi?
Berurusan dengan Pencakar Konten
Situs lain yang mencuri konten Anda dan menerbitkannya kembali tanpa izin terkadang dapat menyebabkan masalah duplikat konten untuk situs Anda. Mesin pencari bekerja keras untuk memastikan bahwa situs pengikis sulit untuk mendapat manfaat dari menggandakan konten Anda . Jika situs pengikis menyebabkan masalah bagi Anda, maka situs itu mungkin dihapus dari indeks Google dengan mengajukan permintaan DMCA dengan Google