Bagaimana cara menangani Duplikat Konten / URL di Joomla?

11

Saya baru saja menemukan masalah SEO utama dan sementara saya telah menyelesaikannya untuk saat ini; Saya mencoba mencari tahu mengapa itu mungkin terjadi di tempat pertama dan jika ada kesalahan atau itu ada hubungannya dengan Joomla itu sendiri. Pertama masalah:

Ketika saya merayapi sebuah situs dengan Moz, itu menunjukkan empat duplikat konten untuk beranda yang tidak terduga. Jadi misalnya untuk beranda http://www.foo.com itu menunjukkan URL konten duplikat seperti berikut:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

Dan semua tautan ini hanya memuat konten beranda namun detail meta berasal dari artikel. Ini jelas menunjukkan bahwa Joomla secara otomatis membuat tautan dan saya menemukan hal yang sama untuk 4 tautan. Tautan dalam artikel itu seperti ini:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

The Itemid = 1berkorespondensi ke item menu homepage yang menjelaskan mengapa homepage itu loading. Saya mencoba menciptakan kembali masalah tetapi tidak bisa. Menurut orang-orang yang menambahkan konten, berikut adalah langkah-langkah yang mereka lakukan saat membuat artikel dan tautan di dalamnya:

  1. Buat Artikel
  2. Tambahkan tautan ke artikel lain menggunakan tab 'Artikel' di editor konten.
  3. Buat item menu ke artikel

Jadi saya bertanya-tanya apakah ada sesuatu yang salah di sini. Saya bingung karena ada lebih dari 100 artikel namun ini hanya terjadi di sekitar 5 artikel. Terima kasih.

sifu
sumber

Jawaban:

15

TOC dari jawaban ini:

  1. Konten di bawah ID Item yang sama
  2. Bagaimana duplikat konten dibuat / Halaman / URL Dinamis
  3. Perspektif SEO
  4. Berurusan dengan duplikat konten di Joomla
  5. Referensi dan tautan

1. Mengapa Artikel ditampilkan di bawah itemid yang sama

Pertama-tama, ini bukan masalah mengapa Anda mendapatkan duplikat url. Artikel-artikel menggunakan id item halaman rumah, karena tidak ada id item lain yang ditugaskan untuk mereka.

Baca lebih lanjut tentang ini:

Dan yang ini mungkin juga berwawasan luas:



2. Bagaimana "duplikat konten" dibuat / halaman dinamis / URL

Ini sebenarnya adalah perilaku standar untuk situs web dinamis yang menghasilkan halaman mereka dengan menggunakan parameter URL untuk membangun String Kueri dalam bentuk pasangan Nilai Bidang . Server / aplikasi akan menerima permintaan, memprosesnya dan mengembalikan konten asosiatif ke browser.

Untuk memahami ini lebih baik, Anda mungkin ingin menonaktifkan Url SEF di situs web Joomla dan mempelajari sedikit Url Non-SEF halaman:

Contoh:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

Memisahkan kueri di atas menjadi pasangan bidang-nilai yang kita lihat:

  • option = com_content
  • lihat = artikel
  • id = 3
  • catid = 9
  • Itemid = 101

Ini adalah nilai bidang yang dipahami Joomla dan akan mencoba mengembalikan konten berikut ini sebagai:

Ini akan meminta dalam komponen com_content dan menggunakan tampilan artikel untuk menampilkan item konten (artikel) dengan id 3, dari id kategori 9, menggunakan Item Menu dengan id 101.


Banyak variasi URL untuk 1 halaman

Namun artikel yang sama dapat ditampilkan dengan lebih banyak kombinasi nilai bidang:

Beberapa kemungkinan kombinasi bisa berupa:

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = en
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en & print = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en & tmpl = komponen

Seperti yang Anda lihat, semua di atas meminta data yang sama dari sistem, yaitu artikel dengan id = 3. Ini mengarah pada fakta bahwa konten / halaman yang sama dapat diakses melalui berbagai url berbeda dan dalam beberapa kasus dapat ditampilkan dalam tata letak yang berbeda.

* Dengan SEF URL diaktifkan di Joomla, yang di atas berpotensi menerjemahkan ke lebih dari 1 SEF URL untuk artikel / konten yang sama.



3. Perspektif SEO

Mesin Pencari Modern dan Google khususnya, menyadari perilaku ini. Biasanya mereka akan mencoba yang terbaik, untuk mengindeks dan menyimpan dalam hasil pencarian mereka URL yang paling cocok untuk sebuah halaman. Selain itu, Google telah mengungkapkan bahwa tidak ada " penalti " sebenarnya untuk konten duplikat karena ini.

Namun, masalah utama dalam hal konten / halaman yang sama telah diindeks lebih dari satu kali, adalah bahwa Anda mungkin kehilangan peringkat halaman dan kinerja SEO terbaik , karena peringkat halaman akan dibagi menjadi lebih dari 1 halaman alih-alih 1 .

Dengan mengingat hal ini, adalah bijaksana untuk menangani hal ini, daripada membiarkan url indeks pengindeksan Mesin Telusur sambil mencoba menebak apakah url yang berbeda menunjukkan konten yang sama atau berbeda.
Selain itu, mengendalikan url Anda dan apa yang SE harus indeks, dapat membantu Anda menghasilkan pengalaman pengguna yang lebih baik secara keseluruhan, karena pengguna situs akan menemukan halaman yang sama di bawah 1 url standar saja, dan dapat menghasilkan struktur yang lebih solid untuk situs web dan manajemennya .



4. Cara menangani Konten Duplikat

  • Menggunakan URL Canonical untuk halaman Anda.
    Url Canonical akan menginstruksikan mesin pencari tentang yang seharusnya merupakan url kanan halaman yang harus dirayapi dan disimpan dalam indeks mereka.

  • Menggunakan metadata INDEX / NOINDEX, FOLLOW / NOFOLLOW. Menggunakan metadata tersebut di halaman Anda, akan menginstruksikan mesin pencari jika Anda ingin mereka mengindeks atau tidak isi halaman dan mengikuti atau tidak tautan yang ditemukan di sana.

  • Menggunakan 301 redirect / htaccess.
    Anda dapat mengarahkan semua URL lain ke yang Anda inginkan di utama. Ini dapat dicapai dengan Ekstensi SEF atau htaccess . Keduanya memberikan kekuatan yang besar, namun htaccess memiliki fleksibilitas besar mengingat kemampuan untuk menggunakan ekspresi reguler untuk semua jenis pengalihan / atau penulisan ulang menggunakan mod_rewrite. Mengenai J Extensions, ketika dibutuhkan, saya biasanya menggunakan sh404SEF .

    Pembaruan: Seperti yang dicatat oleh @Neil Robertson di komentar: satu pengalihan penting adalah dari versi situs web yang bukan www ke versi situs web www atau sebaliknya. Tambahkan ini ke file .htaccess untuk pengalihan non-www ke www.

        ### Redirect non-www to www
        RewriteCond %{HTTP_HOST} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Menggunakan Google Webmasters Tools
    Google Webmasters Tools memiliki opsi untuk menyesuaikan perilaku perayap dengan parameter URL Anda .

  • Menggunakan Peta Situs
    Kirim ke Mesin Pencari struktur URL situs Anda.

  • Menggunakan file Robots.txt
    Google dan SE besar lainnya menghargai Robots.txt Anda. Anda dapat menginstruksikan mereka untuk tidak merangkak direktori / jalur url tertentu.

Semua opsi di atas dapat digabungkan untuk menghasilkan hasil yang diinginkan.

* Seperti di mana-mana, jadi di Joomla, perencanaan yang baik dan organisasi konten selalu membantu mencapai hasil yang lebih baik. Terutama dengan Joomla, ini juga melibatkan kategorisasi konten bersih dan struktur item menu.



5. Referensi dan tautan

Ekstensi SEO Joomla

Biasanya di Joomla jika Anda ingin berurusan dengan ini secara efisien, Anda akan berakhir menginstal ekstensi SEO-SEF pihak ke-3.



Lebih banyak membaca:

FFrewin
sumber
1
salah satu jawaban terbaik di forum ini :) sangat membantu. terima kasih @FFrewin
Joomler
1
Ini jawaban yang sangat bagus. :) Untuk kelengkapan, mungkin baik untuk menambahkan beberapa informasi tentang pengalihan versi non-www situs web ke versi www situs web atau sebaliknya. Ini sering dilupakan tetapi mungkin merupakan penyebab utama duplikat konten di semua situs web (bukan hanya Joomla).
Neil Robertson
Sepertinya router baru akhirnya akan melihat cahaya hari di Joomla 3.8 dan ini akan membantu menyederhanakan url tanpa perlu ekstensi pihak ketiga.
Neil Robertson
1
@NeilRobertson: Saya masih berpikir masih ada ruang untuk perbaikan dan lebih banyak pekerjaan yang diperlukan untuk solusi yang lengkap dan efisien untuk mengelola URL / duplikat SEF di Joomla.
FFrewin
@ Francin saya setuju. Sepertinya beberapa ekstensi pihak ketiga mungkin juga harus diperbarui untuk memanfaatkan router baru.
Neil Robertson
0

Jika saya memiliki beberapa item menu dengan konten yang sama, saya menggunakan System Links / Menu Item Alias ​​yang terletak di Menu Manager. Ini artikel lama tentang itu; tetapi metode ini masih ada sampai sekarang: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias

@Neil, saya setuju 100% tentang konten non-www vs www dibaca duplikat. Berikut adalah kode yang memaksa www menjadi non-www. Tempatkan di file htaccess Anda. Juga, itu menambahkan protokol keamanan https juga. Kode ini bukan satu-satunya metode, tetapi ini yang saya gunakan dengan sukses di banyak situs.

RewriteCond %{HTTP_HOST} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
yaya
sumber