Ketika saya mencari sesuatu di Google, saya kadang-kadang melihat tanggal penerbitan pos / artikel di bawahnya. Saya juga telah mencari artikel saya sendiri yang saya miliki di situs bertenaga Wordpress saya, dan Google juga mengakui tanggal penerbitannya.
Ketika saya membuka sumber situs web saya, saya tidak melihat tag khusus atau apa pun yang menunjukkan tanggal publikasi. Itu hanya ditulis dalam div reguler, dengan tidak ada tag khusus yang akan memberitahu SE bahwa ini adalah tanggal penerbitan (saya bisa memiliki tanggal lain dari hal-hal lain di sekitar halaman juga).
Jadi, apakah hardcoded ke Google tempat yang tepat dari tanggal publikasi Wordpress di pohon DOM, atau saya kehilangan sesuatu?
Saya sedang membangun situs web baru, dengan CMS saya sendiri, dan saya mencoba mencari tahu bagaimana menerapkan pengakuan tanggal yang dipublikasikan.
sumber
Jawaban:
Anda harus melalui sitemap xml atau versi umpan RSS untuk mengindeks data publikasi Anda melalui mesin pencari utama seperti Google, Yahoo, & MSN. Hasilkan sitemap XML untuk situs web Anda dan kirimkan dalam alat master web untuk indeks.
sumber
Saya hanya punya masalah bahwa semua halaman utama saya ditampilkan diperbarui lebih dari 4 tahun yang lalu, meskipun Google tahu itu tidak benar karena halaman telah diindeks selama itu dan berubah secara substansial dari bulan ke bulan. Setelah benar-benar bingung, kemudian benar-benar kesal, kemudian bingung lagi, akhirnya saya menemukan masalah. Persyaratan hukum kami dilayani di div tersembunyi dengan "Pembaruan terakhir: 30 Oktober 2007" dan div tersebut dimuat di hampir semua halaman kami. (Karena itu muncul pada pendaftaran) Saya telah menghapusnya dan sekarang saya menganggap tanggal akan hilang atau diperbaiki untuk sesuatu yang lebih masuk akal.
Kisah peringatan dan satu lagi bukti bahwa mereka memeriksa semantik situs lebih dari rincian teknis atau riwayat pengindeksan mereka sendiri.
sumber
Saya sangat meragukan bahwa tanggal posting atau artikel yang dipublikasikan didasarkan pada
<lastmod>
entri dalam sitemap XML (seperti yang disarankan orang lain) atau header HTTP yang Terakhir Dimodifikasi dalam hal ini. Peta Situs XML hanya berupa penasehat, bukan otoritatif. Tanggal modifikasi dokumen yang terakhir mungkin tidak sama dengan tanggal penerbitan (asli) dari sebuah artikel. Dan, seperti yang saya sebutkan dalam komentar saya di bagian atas halaman, tanggal modifikasi terakhir dari suatu dokumen mungkin lebih penting untuk caching dan mungkin menentukan tingkat perayapan. Header HTTP Yang Terakhir Dimodifikasi dari laman yang dibuat secara dinamis seringkali sangat dekat dengan tanggal / waktu aktual (seperti untuk blog WordPress).Umpan RSS / Atom di sisi lain memang mengandung nugget informasi khusus ini. Dan memang, di situs Wordpress yang tidak memasukkan tanggal publikasi dalam konten, tanggal publikasi masih muncul di hasil pencarian Google. Dan sejauh yang saya tahu, ini cocok dengan tanggal di RSS Feed.
EDIT # 1: Namun, umpan RSS tidak harus berisi semua halaman. Dalam sebagian besar kasus, ini seharusnya hanya berisi halaman terbaru atau yang terbaru diperbarui. Tetapi tidak ada alasan bahwa Google harus melupakan apa yang sudah dibaca, dan menyediakan konten halaman itu tidak berubah maka tanggal modifikasi terakhir juga tidak boleh.
Jika tidak ada umpan RSS, saya pikir Google cukup pintar untuk menganalisis konten halaman. Terutama jika kurma ditandai 'semantik' dengan bantuan mikroformats . Sangat layak bahwa Google akan melihat yang berikut sebagai tanggal yang resmi untuk artikel yang terkandung di dalamnya:
Google tentu tidak membaca Microformats - hCard, hReview, dll
Hanya untuk menambahkan, saya tidak berpikir Google akan menyatakan tanggal publikasi kecuali ia dapat menemukan sesuatu yang otoritatif yang akan menyarankan ini. Itu tidak akan menyimpulkan 'tanggal publikasi' pada data spekulatif, karena 'tanggal publikasi' yang salah tidak berguna bagi siapa pun dan Google akan mendapatkan banyak manfaat untuk itu!Dan hanya untuk catatan (jika @Tom menyarankan sebaliknya :) Saya pikir posting / artikel harus memiliki tanggal publikasi yang terlihat jelas. Banyak yang tidak, dan ini bisa membuat frustasi bagi pembaca terutama ketika meneliti masalah teknologi dan Anda menemukan bahwa setelah membaca setengah dari artikel itu sudah ketinggalan zaman!
EDIT # 2: Sejak itu saya mengalami gangguan yang sama yang @mmdanziger jelaskan dalam jawabannya. Di salah satu situs lama saya, saya memiliki teks dari bentuk "Situs Terakhir Diperbarui Minggu, 17 Juni 2012" (tidak ditandai dengan cara khusus) di bagian atas setiap halaman (ditulis ke halaman dengan JavaScript !!). Ini sama tanggal telah dijemput oleh Google dan sekarang muncul bersama beberapa halaman (tetapi tidak semua) yang muncul di SERPs - ini pasti bukan tanggal mempublikasikan halaman. Tampaknya Google hanya menggesek halaman untuk string bentuk "terakhir diperbarui ( datestring )" (setelah memproses JavaScript !!). Situs khusus ini tidak memiliki umpan RSS. Situs ini memang memiliki file Sitemap.xml tetapi tanggalnya berbeda.
Saya perhatikan perilaku serupa di situs lain juga.
sumber
<div class="footer"> <div class="links"> April 24, 2011 | <a href=...
Ini adalah SATU-SATUNYA tempat yang mengacu pada tanggal posting saya yang dipublikasikan, dan Google menemukannya dan ditampilkan dengan benar di hasil pencarianSaya pikir Google menggunakan Peta Situs dan umpan RSS untuk mengenali tanggal yang dipublikasikan .. Anda dapat menerapkan fitur ini dalam CMS Anda dengan membuat peta situs xml sesuai dengan Standar .
sumber
Menurut Jonh Mueller di Google:
Namun, saya menemukan kemungkinan besar bahwa Google mencari tanggal di halaman web di tempat-tempat berikut:
sumber
Saya pikir ini dengan cerdas mencari tanggal di halaman dan ketika yakin bahwa itu adalah tanggal yang relevan ia menggunakannya.
Agak sulit kadang-kadang karena saya pikir itu dapat memiliki dampak negatif pada kemampuan klik SERP, saya kira itu dapat memiliki dampak positif sementara jika ini adalah artikel / posting baru-baru ini tetapi saya cukup yakin situs saya akan lebih baik tanpanya (Pencari Google mungkin tidak lebih baik tanpanya!)
Tidak ada opsi untuk mengontrolnya melalui Google, hanya dengan metode Anda sendiri. Anda dapat:
Untuk alasan ini saya akan mengabaikannya.
sumber