Baru-baru ini, saya perhatikan bahwa saya memiliki daftar kesalahan Soft 404 yang berkembang di Alat Webmaster Google. Semuanya untuk halaman hasil pencarian yang dibuat secara dinamis yang melaporkan "Tidak ditemukan kecocokan".
Saya tidak mengerti apa Google artinya dengan lembut 404 dan mengapa mereka melaporkan untuk halaman ini. Jadi saya menambahkan <meta name="robots" content="noindex">
ke halaman-halaman ini.
Namun, Google masih melaporkan kesalahan Soft 404 baru untuk halaman yang menggunakan meta tag noindex .
Mengapa Google melaporkan setiap kesalahan untuk halaman saya mengatakan kepada mereka untuk tidak indeks?
Masalahnya adalah bahwa dengan semua kesalahan yang tidak diinginkan ini, saya tidak dapat melihat apakah ada masalah nyata yang perlu diperbaiki.
Beberapa mengatakan bahwa halaman ini harus mengembalikan kode status 404. Tapi itu hanya menggeser masalah ke tab kesalahan 404. Selain itu, Google mengembalikan kode status 200 untuk halaman tanpa hasil .
Saya tidak ingin memblokir akses dengan robots.txt karena saya ingin tautan pada halaman ini diikuti dan saya ingin Google melihat tag meta noindex . Selain itu, tidak ada pola yang bisa saya gunakan untuk memblokir ini.
Google menemukan URL ini di tempat pertama karena konten dulu ada, tetapi sejak itu telah dihapus. Saya tidak dapat mengembalikan kode status 410, karena kode PHP saya tidak memiliki cara untuk mengetahui alasan mengapa tidak ada hasil yang ditemukan.
Adakah yang bisa saya lakukan untuk membuatnya lebih mudah untuk melihat masalah sebenarnya?
sumber
Jawaban:
Anda harus mencegah Google merayapi halaman pencarian situs. Google tidak ingin menjelajah pencarian situs Anda sama sekali . Berikut adalah posting blog Google Matt Cutts tentang masalah ini: Hasil pencarian dalam hasil pencarian oleh Matt Cutts pada 10 Maret 2007 . Google sekarang secara aktif menghukum situs yang memungkinkan hasil pencarian situsnya dirayapi dan muncul di SERP Google. Dengan mengizinkan Googlebot merayapi halaman hasil pencarian Anda, Anda mempertaruhkan semua lalu lintas rujukan Google Anda. Salah satu trik favorit pengulas Google adalah menggunakan pencarian situs Anda untuk istilah spam seperti "Viagra". Ketika mereka melihat halaman yang dapat dirayapi sebagai hasilnya (bahkan jika dikatakan "tidak ada hasil untuk Viagra ditemukan") mereka akan menerapkan penalti manual terhadap situs Anda sebagai situs spam.
Anda harus memasukkan pencarian situs Anda ke dalam
robots.txt
. Pastikan saja Googlebot masih dapat menjelajah halaman konten Anda. Anda kemudian akan berhenti melaporkan kesalahan 404 lunak baru.Sejumlah besar 404 kesalahan (bahkan 404 kesalahan lunak) tidak merusak peringkat situs Anda. Google melaporkan kesalahan pada halaman mana pun yang dapat mereka temukan dan jelajahi, apakah Anda ingin diindeks atau tidak, dan apakah Anda bahkan menautkannya atau tidak. Mereka melakukan ini karena laporan kesalahan semata-mata untuk keuntungan Anda dan mereka merasa Anda harus diberi tahu sepenuhnya.
Inilah yang dikatakan John Mueller dari Google tentang hal itu :
sumber