Apakah Google menghukum tag <lastmod> yang diperbarui setiap hari di peta situs jika data tidak diperbarui setiap hari?

10

Saya mendapat peta situs yang dibuat setiap hari dengan banyak tautan ke halaman produk. Produk-produk ini diimpor setiap hari dari sumber data lain. Karena pembaruan terdiri dari membuang semua info produk saat ini dan menggantinya dengan info impor baru, tanggal modifikasi terakhir selalu melonjak satu hari. Ini juga digunakan di sitemap. Bahkan untuk produk yang belum berubah. Semua halaman produk berpura-pura telah diperbarui.

Apakah Google akan menghukum situs web karena berpura-pura halaman telah berubah dari hari ke hari sementara belum?

Solusi saya adalah hanya mengubah entri saja jika data produk impor baru berbeda dari data sebelumnya. Saya hanya ingin memastikan ini adalah upgrade yang berguna untuk dibuat, sementara saya juga bisa menghabiskan waktu saya untuk peningkatan lainnya.

Memperoleh
sumber

Jawaban:

5

Saya belum pernah mendengar tentang penalti karena hal ini. Paling buruk, Anda menyia-nyiakan waktu laba-laba, tetapi itulah bagian dari mengapa kita memiliki komputer di tempat pertama: melakukan hal-hal berulang yang membosankan. Namun, idealnya Anda harus mengatasi masalah ini.

Ini...

Solusi saya adalah hanya mengubah entri saja jika data produk impor baru berbeda dari data sebelumnya.

... adalah apa yang seharusnya Anda lakukan di awal, terlepas dari pertimbangan eksternal seperti peta situs, dll. Jika konten Anda tidak berbeda (dan saya akan menyertakan menghapus dan mengganti dengan informasi yang identik dalam deskripsi itu), maka lastmodtanggal Anda tidak boleh dapat dimodifikasi. Di sini Anda menghabiskan sumber daya Anda sendiri. Anda belum mengatakan berapa banyak produk yang terlibat, tetapi akan ada titik di mana proses ini akan menjadi lambat dan mahal secara komputasi.

Su '
sumber
Saya sangat setuju. Namun, saya dapat diandalkan di perusahaan lain yang mengirimkan data. Mereka selalu mengirim setiap produk (+200) dalam ekspor data mereka. Jadi memperbarui lot tampak solusi terbaik beberapa tahun yang lalu. Klien saya tidak memiliki anggaran untuk menyelesaikan ini dengan benar. Mantan / impor ini terjadi pada malam hari, jadi sumber daya yang digunakan tidak menjadi masalah besar saat ini.
Menimbulkan
@Elicit jika Anda masih memiliki masalah ini, simpan saja ekspor data dari hari sebelumnya dalam format asli yang dapat diuraikan dan lakukan perbandingan gaya git untuk melihat produk apa yang telah berubah. Meskipun menyenangkan, Anda tidak perlu mereka mengirimi Anda produk yang diubah saja; Anda harus bisa mengetahuinya sendiri.
Penguin Anonim
3

Saya tidak pernah menyukai gagasan memperbarui <lastmod>setiap hari karena tidak hanya salah, tapi juga mesin pencari yang menyesatkan.

Dalam posting di SO , Google Gary Illyes menulis:

Tag lastmod adalah opsional dalam peta situs dan dalam sebagian besar kasus itu diabaikan oleh mesin pencari, karena webmaster melakukan pekerjaan yang mengerikan dengan menjaganya agar tetap akurat.

Saya umumnya menganjurkan untuk menggunakan <lastmod>dengan benar, atau tidak sama sekali. Meninggalkannya (dan juga <changefreq>& <priority>) bahkan membuat file itu sendiri lebih kecil dan lebih cepat untuk mesin pencari untuk membaca juga.

Andrew Lott
sumber
2

Tidak. Google akan menggunakan lastmodsebagai petunjuk (sama dengan semua nilai sitemap) tetapi jika memutuskan bahwa konten Anda tidak diperbarui setiap hari, maka ia akan mengabaikannya dan mengunjungi kembali halaman Anda sesuai jadwal sendiri.

DisgruntledGoat
sumber
2

Saya tidak bekerja untuk Google, dan tidak bisa mengatakan dengan pasti apa yang sebenarnya mereka lakukan, tetapi cara yang masuk akal bagi mereka untuk menangani <lastmod>cap waktu adalah sebagai petunjuk untuk tidak membuang waktu merayapi kembali halaman yang belum berubah.

Jadi, jika Anda melaporkan semua halaman Anda sebagai diubah setiap hari, Googlebot akan terus merayapi semua halaman Anda dalam urutan apa pun rasanya, daripada hanya berfokus pada halaman yang telah berubah. Akibatnya, seolah-olah Anda tidak melaporkan stempel waktu modifikasi terakhir sama sekali.

Alasan utama untuk memberikan <lastmod>stempel waktu yang benar adalah untuk membuat perubahan pada situs Anda muncul lebih cepat dalam indeks Google. Jika Anda memiliki ratusan halaman di situs Anda, perlu beberapa saat bagi Google untuk merayapi semuanya dan menemukan perubahan apa pun. Namun, jika Anda memberi tahu Googlebot halaman mana yang telah berubah baru-baru ini, Googlebot dapat merayapi halaman-halaman itu terlebih dahulu dan menghindari membuang begitu banyak waktu untuk sisanya.

Tentu saja, Anda hanya dapat meningkatkan laju perayapan Googlebot di Alat Webmaster dan berharap yang terbaik. Tapi sungguh, seharusnya tidak terlalu sulit untuk membuat skrip pembaruan Anda menjaga cap waktu. Misalnya, saya menganggap Anda sedang melakukan sesuatu seperti ini:

for each product do:
    write new page content into product page file;
end do;

Jika demikian, ubah saja ke sesuatu seperti ini sebagai gantinya:

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;
Ilmari Karonen
sumber
2

Tidak itu hanya mengabaikan informasi yang Anda berikan ketika itu salah. Dalam hal ini, perayap web mengetahui sendiri seberapa sering mereka merayapi laman Anda.

Jérôme Verstrynge
sumber
Tautan rusak ...
Victor Schröder
1

Google tidak akan menghukum Anda untuk ini. Untuk mendapatkan penalti, Anda benar-benar harus pergi topi hitam di pantat Google jadi jangan khawatir tentang itu. Google akan segera mengetahui jika konten Anda memiliki perubahan (itulah yang telah mereka kerjakan beberapa tahun terakhir) dan menggunakan properti lastmod sebagai petunjuk.

Steven Van Vessum
sumber
1

Saya sarankan Anda untuk membaca Praktik terbaik untuk peta situs XML & RSS / umpan Atom

Waktu modifikasi terakhir

Tentukan waktu modifikasi terakhir untuk setiap URL dalam peta situs XML dan umpan RSS / Atom. Waktu modifikasi terakhir adalah kapan terakhir kali konten halaman berubah secara bermakna. Jika perubahan dimaksudkan agar terlihat dalam hasil pencarian, maka waktu modifikasi terakhir adalah waktu perubahan ini.

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

Pastikan untuk mengatur atau memperbarui waktu modifikasi terakhir dengan benar:

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.
John
sumber
Terima kasih atas pembaruannya. Semoga downvoter akan melihatnya dan membalikkan suara mereka.
John Conde