Saya menggunakan Drupal 7, dan saya mencoba menggunakan tag meta "noindex" untuk mencegah http://example.com/comment/reply/43/738 agar tidak diindeks oleh mesin pencari.
Halaman komentar / balasan sedang diindeks, meskipun saya telah menggunakan peran berikut di robots.txt:
Disallow: /comment/reply/
Di mana file templat yang saya perlukan untuk memasukkan meta tag "noindex" untuk / komentar / balasan / halaman?
robots.txt
file Anda ?Jawaban:
Anda dapat menggunakan kode ini di robots.txt:
Ini akan mengabaikan setiap URL yang berisi komentar .
Anda juga dapat menggunakan yang berikut ini, untuk mengabaikan setiap URL yang mengandung / komentar .
Setelah Anda melakukan ini, periksa apakah berfungsi atau tidak dengan menggunakan pemeriksa Google Robots.txt .
sumber
Di template.php tema Anda, atau di page.tpl.php, Anda dapat memeriksa url halaman untuk melihat apakah halaman tersebut adalah halaman komentar, lalu tambahkan kode yang akan memasukkan tag meta.
Anda dapat melakukan ini di fungsi template.php YOURTHEME_preprocess_html (), atau masukkan di suatu tempat dekat bagian atas page.tpl.php. Kode yang ditambahkan adalah kira-kira seperti ini:
Lihat drupal_add_html_head () .
sumber
Pembaruan : karya-karya berikut ini, ia mencetak
<meta name="robots" content="noindex,follow" />
di bagian kepala semua halaman yang diakses melalui jalur yang dimulai dengancomment
. Ini untuk mengatasi kenyataan bahwa halaman seperti comment / 3 internal membawa node / nid sebagai argumen, seperti yang ditunjukkan jmarkel di atas.Dengan bantuan komentar yang bermanfaat pada fungsi arg .
Semoga ini pada akhirnya akan ditangani oleh modul Meta Tag - ada permintaan fitur , tetapi belum jelas apakah pembuat modul ingin mendukung ini.
[Komentar saya sebelumnya] Saya hanya ingin menambahkan bahwa menggunakan robots.txt bukan jawabannya - seperti yang sudah Anda perhatikan, tautan tetap muncul di hasil pencarian meskipun menggunakan
Disallow: /comment
. Ini diharapkan, karena robots.txt memberi tahu bot untuk tidak merayapi halaman-halaman itu, tetapi tidak memberitahu Google untuk tidak mengindeksnya. Seperti yang dijelaskan pada SEOmoz Robots.txt dan Praktik Terbaik Meta Robots untuk Optimasi Mesin Pencari :sumber