Bagaimana Google memperlakukan fragmen hash di dalam URL kanonik

13

Saya telah melihat banyak situs web menggunakan siput di URL mereka untuk meningkatkan SEO seperti ini:

http://example.com/article/1543/how-to-boost-seo/

Saya berpikir jika saya bisa melakukan sesuatu seperti ini:

http://example.com/article/1543#how-to-boost-seo

dan tentukan sebagai URL kanonik. Artikel dari Google ini mengatakan, "Ini isyarat bahwa kami sangat menghormati." Apakah itu termasuk pengidentifikasi fragmen, atau akan dibuang?

Pertanyaan Melimpah
sumber

Jawaban:

13

Pengidentifikasi fragmen secara tradisional digunakan untuk mengidentifikasi sebagian dokumen untuk aplikasi sisi klien. Sebagaimana dinyatakan dalam spesifikasi yang diadopsi Google:

Secara tradisional, fragmen hash (yaitu, semuanya setelah # di URL) telah digunakan untuk menunjukkan satu bagian dari dokumen HTML statis. ... potongan hash bukan bagian dari permintaan HTTP (dan sebagai akibatnya tidak dikirim ke server)

Akibatnya sebagai ini meliputi, Googlebot mengabaikan fragmen hash secara default. Karena itu untuk URL ini:

http://example.com/article/1543#how-to-boost-seo

Googlebot hanya harus melihat sumber daya dikembalikan oleh server: http://example.com/article/1543sementara mengabaikan fragmen hash: how-to-boost-seo.

Jadi pada dasarnya sumber daya untuk URL di atas adalah URL kanonik setelah normalisasi (yaitu, menghapus fragmen).

Tujuan menggunakan siput adalah untuk mengidentifikasi halaman sebagai kata kunci yang dapat dibaca manusia. Menggunakan fragmen membingungkan tujuan ini dan mengaburkan keterbacaannya:

/how-to-boost-seo jauh lebih mudah dibaca daripada: /1543#how-to-boost-seo

Jadi singkatnya, menggunakan fragmen sebagai siput tidak akan bermanfaat bagi pengguna atau mesin pencari.

dan
sumber
1
Terimakasih atas infonya. Saya membaca spesifikasinya, tetapi kata-katanya tidak begitu jelas. Ini seperti mencoba menyimpulkan apa yang akan diindeks Google berdasarkan dokumen yang dimaksudkan untuk perayapan AJAX. Keterbacaan dapat ditingkatkan dengan menambahkan /seperti ini /1543#/how-to-boost-seo.
Pertanyaan Overflow
Lihatlah bagian terakhir (nomor 6) dari tautan ketiga dalam jawaban saya di sini . Google mengabaikan semuanya setelah hash, terlepas dari garis miring setelahnya, karena perlu menormalisasi URL untuk mencegah duplikat konten. Jika Anda perlu menggunakan hash dalam URL, Anda harus menggunakan hash bang #!seperti tercakup dalam spesifikasinya.
dan
1
Saya menemukan ini yang menyarankan bahwa Google melakukan hash indeks untuk menyediakan tautan " lompat ke " dalam hasil pencarian. Sekarang lebih jelas, setidaknya bagi saya, bahwa potongan hash tidak dapat digunakan dalam hasil utama.
Pertanyaan Overflow
Ya, itu untuk cuplikan kaya. Sebagian besar mesin pencari adalah sama, jika tidak satu halaman dengan banyak tautan jangkar di atasnya akan menghasilkan halaman yang sama diindeks beberapa kali, menghasilkan konten duplikat.
dan