Apakah masuk akal untuk mengembalikan 410 daripada 404 ketika beberapa halaman telah dihapus secara permanen?

16

Apakah masuk akal untuk mengembalikan 410alih - alih 404ketika beberapa halaman telah dihapus secara permanen? Dalam video ini , Matt Cutts mengatakan bahwa Google memperlakukan mereka sama, tetapi adakah alasan lain untuk menerapkan 410(kecuali untuk kebenaran teknis)?

orang besar
sumber
Saya bertanya-tanya tentang ini sendiri. Sepertinya 410 sudah tidak digunakan lagi.
wogsland

Jawaban:

7

Di situs web kami, kami baru-baru ini menerapkan 410 kesalahan untuk halaman yang telah dihapus secara permanen. Kami memiliki sekitar 40 juta halaman di indeks Google dan bisa dirayapi dengan 2 juta permintaan per hari oleh Googlebot.

Setelah membersihkan basis data kami, kami menemukan sejumlah besar 404 kesalahan yang terus muncul di Kesalahan Perayapan di Alat Webmaster. Ketika kami beralih ke 410 status alih-alih 404, jumlah kesalahan per hari berkurang setengahnya, sementara jumlah total permintaan yang dilakukan tetap sama. Jadi itu lebih sukses merangkak halaman per hari pada akhirnya. Sepertinya halaman dengan status 404 dirayapi beberapa kali sebelum dihapus sepenuhnya dari indeks.

Jadi saya akan mengatakan, ya pasti layak menggunakan 410 jika perlu untuk menjaga anggaran Google Crawl Anda.

Verefff Stefan
sumber
11

Ada lebih dari Google di dunia ini. A 410 dengan jelas memberi tahu bot bahwa file tersebut hilang. A 404 tidak. Bot yang persisten mungkin terus berusaha menemukan 404 tanpa batas waktu sementara mereka mungkin berhenti mencoba menemukan 410 segera yang akan membuat server Anda sangat bahagia.

John Conde
sumber
2
Namun demikian, keduanya berjalan: bot yang benar-benar jelek mungkin hanya mengenali 200 dan 404.
Peter Taylor
4
@ Peter tidak yakin itu penting - jika mereka jelek dan tidak mengerti kode HTTP maka apa ruginya? Jika Anda menggunakan 404 maka bot jelek dan baik akan terus meminta halaman, sedangkan dengan 410 hanya yang jelek akan.
DisgruntledGoat
1
Apa yang dikatakan @DisgruntledGoat. Lihat Hukum Postel . Implementasi yang jelek tidak bisa dipertanggungjawabkan; apa yang akan Anda lakukan, coba dan pertanggungjawabkan semua dari mereka dan setiap kebiasaan khusus mereka, semuanya pada saat yang sama? Ada beberapa pengecualian, seperti dominasi browser IE6 yang sudah lama ada, tetapi secara umum itu tidak sepadan dengan usaha.
Su '
6

Selain ada lebih banyak mesin pencari daripada Google di luar sana, juga tidak ada alasan untuk menganggap bahwa Google tidak akan pernah mengubah cara mereka memperlakukan 410 respons. Memang, sepertinya itu sudah terjadi: informasi yang dikutip oleh Cut Cutts dalam video tersebut berasal dari 2007, sedangkan posting ini dari 2009 oleh John Mu di forum Webmaster Central Google mengatakan sebaliknya:

"Saya menindaklanjuti hal 404 vs 410 dengan tim di sini. Seperti yang disebutkan oleh beberapa orang lain di sini & di tempat lain, kami umumnya memperlakukan mereka sama di masa lalu.

Namun, setelah melihat bagaimana webmaster menggunakannya dalam praktiknya, kami sekarang memperlakukan kode hasil HTTP 410 sebagai "lebih permanen" daripada 404. Jadi, jika Anda benar-benar yakin bahwa sebuah halaman tidak lagi ada dan tidak akan pernah ada lagi, menggunakan 410 kemungkinan akan menjadi hal yang baik. "

Jadi sepertinya Google sekarang memperlakukan 410 respons berbeda dari 404s.

Ilmari Karonen
sumber
4

Dalam pengalaman saya, Google tidak mengerti 410 kode kesalahan.

Beberapa waktu lalu, saya mengubah situs lengkap sehingga semua URL lama adalah "410 Hilang". Saya tidak dapat menggunakan pengalihan 301 karena tidak ada hubungan langsung ke URL baru.

Saya menggunakan .htaccessuntuk memberi tahu Google bahwa URL lama hilang, tetapi terus memberi tahu saya ada 404 kesalahan besar di situs saya. Saya memeriksa URL di laporan galat perayapan dan semuanya 410, bukan 404 seperti yang dinyatakan.

pengguna2623424
sumber
1

Ada lebih dari Google di dunia ini.

Dikutip untuk kebenaran. Dengan persyaratan Anda, untuk memberi tahu bot (dan mungkin juga manusia) bahwa sebuah halaman telah dihapus secara permanen , saya sebenarnya akan memilih untuk 301mengalihkan ke halaman yang menjelaskan (jika perlu) mengapa konten itu dihapus, atau mengambil bot / pengguna kembali ke halaman indeks.

Kode kesalahan HTTP yang kurang dikenal biasanya tidak didukung, dipahami, atau diterapkan dengan baik, jadi saya biasanya tetap menggunakan kode yang ada untuk memastikan pengalaman menjelajah yang diharapkan dan semoga mulus.

Memilih opsi mana yang akan digunakan tergantung pada berapa banyak permintaan yang masih harus dipenuhi untuk konten (yang sekarang) hilang.

stealthyninja
sumber
1
Mengapa perlunya menjelaskan penghapusan berarti Anda perlu 301 ke URL yang berbeda dengan penjelasan itu? Penjelasannya bisa di halaman itu sendiri, dengan status 410 sehingga mesin pencari mengerti bahwa itu sudah mati.
IMSoP