WordPress dengan SOFT 404 di Google Search Console (WMT) Apa yang menyebabkan Q82019309.com?

8

Situs saudara saya yang saya rancang untuknya beberapa saat memiliki ratusan SOFT 404 yang dilaporkan di Google Search Console sebelumnya Webmaster Tools. Secara umum saya menemukan memperbaiki soft 404 mudah tetapi ini membuat saya sedikit bingung. Semua kesalahan lunak mengembalikan string aneh yang berisi Q82019309.comdengan sub folder sesekali Aristocratdalam string /?=.

404 umumnya terlihat seperti:

  • Dikodekan: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Diterjemahkan: /search/大奖总代Q82019309.com

Tautan dari informasi menyediakan:

  • Dikodekan: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Diterjemahkan: /?s=大奖总代Q82019309.com

Pada awalnya saya percaya ini adalah masalah yang terisolasi tetapi setelah menyelidiki saya menemukan bahwa masalah ini benar-benar mempengaruhi ribuan situs web dan seseorang harus mengetahui penyebabnya. Ketika saya Google Q82019309.com WordPress atau Aristocrat Q82019309.com saya kewalahan dengan jumlah hasil, termasuk beberapa situs terkenal seperti:

Pertanyaan:

Jadi apa yang menyebabkan soft error 404 ini dengan string Q82019309.comdengan atau tanpa Aristocrat.

Simon Hayter
sumber
Situs Anda telah diretas. Q82019309.com dikompromikan.
closetnoc
Pergi ke situs Q82019309.com mengatakan ini adalah situs serangan dan saya setuju bahwa itu cerdik tapi saya merasa sulit untuk percaya bahwa semua situs ini telah diretas dengan sesuatu yang menggunakan string kueri dalam pencarian. Ada ratusan ribu situs web sastra yang melaporkan Q82019309.com ... yang sangat terkenal ... tentu ini tidak semuanya diretas?
Simon Hayter
Tautan tampaknya semuanya spam. Profil yang sangat khas. Juga, ini tampaknya khusus untuk situs WP. Ini tampaknya cukup baru, hanya dalam beberapa hari (4 atau lebih). Periksa instalasi WP untuk memastikan semuanya sudah terbaru. Lihat: web.nvd.nist.gov/view/vuln/…
closetnoc
Ditemukan lebih dari seminggu yang lalu 13.
Simon Hayter
Saya pikir saya harus melihat melalui errors.log dan access.logs untuk mengidentifikasi apakah seseorang telah mencoba atau masuk melalui hack baru.
Simon Hayter

Jawaban:

2

Kami mengalami masalah yang sama di wisepops.com sejak 3 Januari 2017.

Google mengeluhkan Soft 404 bahkan jika pengindeksan dinonaktifkan pada halaman ini. Halaman pencarian Wordpress secara default memiliki meta ini:

<meta name="robots" content="noindex,follow">

Saya memutuskan untuk membuat halaman pencarian tanpa hasil mengembalikan kode HTTP 404. Karena permintaan pencarian ada di URL, tidak masalah untuk menanganinya dengan cara ini.

Untuk Wordpress, saya menambahkan di akhir theme. functions saya:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');
Wisepops
sumber
@ wisepops.com: Saya memiliki masalah yang sama dengan Serangan Pencarian-Spam yang bodoh ini. Terima kasih untuk kodenya! Ini bekerja dengan baik untuk saya! Sekarang pencarian kosong mengembalikan 404 bersih dan itu keren. Hormat kami, Mitschu
Mitschu
Apakah ini mengirim pengguna aktual yang melakukan pencarian dan mendapat hasil nol ke halaman 404 juga?
brandozz
1

Bagi saya sepertinya ada sesuatu yang menghubungkan ke fungsi pencarian situs Anda dengan permintaan yang buruk. Kueri pencarian itu tidak mendapatkan "hasil ditemukan". Googlebot menemukan tautan-tautan itu dan Anda mengizinkan Googlebot untuk merayapi pencarian situs Anda. Karena "tidak ada hasil", Google mendeteksi mereka sebagai "soft 404".

Membiarkan Google merayapi hasil pencarian situs Anda adalah hal yang tidak boleh. Itu bisa membuat seluruh situs Anda dihukum oleh Google. Lihat Matt Cutts: Hasil pencarian di hasil pencarian . Anda harus melarang semua perayapan hasil pencarian menggunakan robots.txt :

Disallow: /search
Disallow: /?s=

Maka Googlebot tidak akan merayapi URL tersebut dan melaporkan kesalahan di sana juga.

Stephen Ostermiller
sumber
Stephen, apakah ini menyerap 404 lunak? Saya sebenarnya telah menambahkan ini ke robots.txt saya dan menandai semua soft 404 saya di halaman pencarian sebagai diperbaiki. Setelah saya memverifikasi, saya akan menandai ini sebagai benar. Tetapi ini tampaknya menjadi solusi terbaik.
brandozz