Saya menemukan artikel ini dalam berita SEO saya hari ini. Tampaknya menyiratkan bahwa Anda dapat menggunakan Noindex:
arahan selain Disallow:
arahan standar di robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Sepertinya itu akan mencegah mesin pencari dari merayapi halaman satu, dan mencegah mereka mengindeks halaman dua.
Apakah arahan robots.txt ini didukung oleh Google dan mesin pencari lainnya? Apakah itu bekerja? Apakah ini didokumentasikan?
web-crawlers
robots.txt
googlebot
noindex
Stephen Ostermiller
sumber
sumber
disallow
Google berhenti menemukan tautan pada laman induk dan anak jika ada. Meskipunnoindex
hanya menghentikan halaman yang terdaftar, itu tidak menghentikan penemuan sementara melarang.nofollow
kerjanya untuk tag meta. Akan menyenangkan untuk mengetahui apakah itu juga kasus untuk robots.txt .<a rel="no-follow">
. Saya tidak melihat alasan mengapa itu akan diperlakukan berbeda. Jelas ini tidak resmi dan bahkan direkomendasikan oleh John Muller untuk tidak menggunakannya di robots.txt tetapi selain dari tweetnya, saya belum berhasil menemukan banyak informasi tentang itu.Noindex
arahan dalamrobots.txt
file sebagai kesalahan.Jawaban:
Google digunakan untuk secara tidak resmi mendukung
Noindex
arahan di robots.txt, namun pada 2019, mereka mengumumkan bahwa arahan tidak akan berfungsi lagi.Berikut adalah apa yang dikatakan John Mueller dari Google
Noindex:
di robots.txt :Sebelum Google mengumumkan fitur tersebut dihentikan, deepcrawl.com melakukan beberapa pengujian fitur dan menemukan bahwa:
Mengingat bahwa Google menghentikan fitur, itu tidak boleh digunakan lagi.
Alih-alih, gunakan tag meta robot yang didukung dan didokumentasikan dengan baik untuk mencegah pengindeksan:
sumber