Jadi, di semua situs kami yang tidak berhadapan dengan pencarian, kami telah menerapkan file robots.txt (per Bagaimana cara mengecualikan situs web dari hasil pencarian Google real-time?, Atau pertanyaan serupa lainnya).
Namun, jika istilah pencarian cukup spesifik, domain itu sendiri dapat ditemukan melalui hasil. Contoh dari ini dapat ditemukan di sini . Seperti yang dapat Anda lihat dari tautan, domain itu sendiri dapat ditemukan (konten tidak di-cache, tetapi domain terdaftar). Selain itu, melakukan pencarian dengan site:hyundaidigitalmarketing.com
3 hasil harus. Memeriksa backlink juga menyediakan beberapa hal, tetapi saya jelas tidak dapat mencegahnya (menghubungkan diizinkan dalam konteks) atau mengontrol bagaimana hal ini ditangani (tidak dapat memberi tahu host untuk menambahkan nofollow, noindex).
Sekarang, saya tahu ini adalah kasus tepi yang parah, namun klien perusahaan saya hanya melakukan ini. Faktanya, domain kami cukup bagus, sehingga bahkan pencarian yang tampaknya sewenang-wenang menghasilkan hasil yang relevan. Sekarang, saya harus menulis laporan tentang bagaimana / mengapa ini terjadi.
Jadi, saya beralih ke jaringan Stack Exchange yang bagus untuk membantu saya memahami apa yang hilang atau memahami apa yang terjadi. Tautan ke artikel industri sangat membantu tetapi, apa pun yang dapat Anda berikan jelas sangat bermanfaat. Saya bermaksud menawarkan hadiah yang terbaik yang saya bisa untuk membuat ini menjadi jawaban untuk beralih di masa depan.
Sunting: Saya telah membuka hadiah untuk pertanyaan ini dengan harapan mendapat lebih banyak tanggapan tentangnya. Saya juga memberikan hasil penelitian saya sendiri di bawah ini.
sumber
Saya pikir Matt Cutts membicarakan hal ini. Jika ingatan saya benar, itu ada hubungannya dengan menautkan. Ini lebih dari itu: http://www.google.com/support/forum/p/Webmasters/thread?tid=2720810fa226e9c8&hl=id
Anda dapat menghapusnya dengan alat penghapusan Google.
sumber
noindex, follow
agar semua PageRank didistribusikan dari back-link yang mungkin terjadi.site:hyundaidigitalmarketing.com
atau untuk persyaratanhyundai digital marketing
, domain itu sendiri akan terus muncul sebagai hasil pertama dan terbaik. Saya perlu mencegah ini.links:hyundaidigitalmarketing.com
menunjukkan tautan balik. Saya jelas tidak bisa mencegah atau mengontrol format backlink DAN itu mungkin valid. Jika menautkan ke situs menyebabkan ini saya perlu memahami bagaimana / mengapa sehingga saya bisa menjelaskan hal ini kepada atasan saya. Saya harap ini menjelaskan pertanyaan saya sedikit lebih baik.Berdasarkan penelitian saya pada subjek, saya telah menemukan bahwa tidak ada cara dijamin 100% untuk mencegah pengindeksan dan caching data, tetapi Anda bisa sangat dekat (dengan asumsi Anda ingin berurusan dengan peningkatan lalu lintas bot). Begini cara saya menginterpretasikan informasi.
Orang akan berpikir bahwa file robots.txt digunakan untuk mendefinisikan informasi robot di seluruh situs dan meta tag digunakan untuk detail spesifik halaman. Saya pikir semangat di balik 2 persis seperti ini, tetapi ini tidak terjadi dalam praktiknya.
Jangan membuat file robots.txt
Ini bekerja dengan semua penyedia pencari utama untuk mencegah konten muncul di SERP, tetapi tidak tidak mencegah pengindeksan. Ini juga mencegah bot merayapi halaman Anda sehingga tag meta robot apa pun (lihat di bawah) juga diabaikan. Karena ini, Anda tidak dapat menggunakan 2 bersama-sama dan inilah sebabnya, jika Anda ingin mencegah pengindeksan, Anda tidak boleh menggunakan file robots.txt.
Catatan: Google memang mendukung penggunaan
Noindex: /
di robots.txt, tetapi tidak berdokumen (siapa yang tahu kapan itu akan rusak) dan tidak diketahui apakah ini bekerja untuk orang lain.Gunakan header HTTP atau tag META HTML untuk mencegah semuanya
Tidak seperti file robots.txt, tag meta robots (dan HTTP Header) didukung secara luas dan, secara mengejutkan, kaya fitur. Ini dirancang untuk diatur pada setiap halaman, tetapi adopsi
X-Robots-Tag
header terbaru membuatnya mudah untuk mengatur situs-lebar. Satu-satunya downside dengan metode ini adalah bahwa bot akan merayapi situs Anda. Ini dapat dibatasi dengan menggunakannofollow
, tetapi tidak semua bot benar-benar menghargainofollow
.Saya menemukan banyak informasi dalam posting blog yang ketinggalan zaman ini . Rilis aslinya adalah 2007 tetapi, karena banyak informasi tentang itu adalah fitur yang lebih baru sejak itu, tampaknya semakin diperbarui secara berkala.
Singkatnya, Anda harus mengirim tajuk HTTP dari
X-Robots-Tag: noindex,nofollow,noodp,noydir
. Inilah uraian alasannya:nofollow
harus membatasi jumlah halaman yang dirayapi di situs Anda, menjaga lalu lintas bot turun. *noindex
Memberitahu mesin untuk tidak mengindeks halaman.noindex
sudah cukup. Namun, saya telah menemukan bahwa bahkan jika Anda mengatakannoindex
situs Anda mungkin diindeks karena situs lain yang terhubung dengannya. Cara terbaik untuk mencegah tautan situs umum dari Y! Direktori (noydir
) dan Direktori Terbuka (noodp
).Ini akan bekerja di 99% kasus. Namun perlu diingat bahwa masih mungkin untuk diindeks dalam beberapa kasus oleh beberapa penyedia. Google mengaku sepenuhnya menghormati
noindex
, tetapi saya curiga.Akhirnya, jika Anda diindeks, atau telah diindeks, satu-satunya cara untuk mendapatkan informasi Anda di-indeks adalah mengikuti berbagai cara dari masing-masing penyedia untuk meminta situs / url dihapus. Jelas ini berarti Anda mungkin ingin memonitor situs / halaman menggunakan sesuatu seperti Google Alerts (terima kasih @ Jo).
sumber
Saya pikir masalah dasar Anda adalah tautan balik ke situs karena ini memberikan mesin pencari titik masuk ke situs dan membuat mereka menyadarinya. Jadi, meskipun mereka tidak akan menampilkan deskripsi untuk situs mereka dapat menampilkan URL jika mereka pikir itu yang paling cocok untuk hasilnya.
Baca artikel ini yang ditautkan dari yang @joe diposting: Matt Cutts menjaga google keluar
Bit kuncinya adalah:
Penelitian yang telah Anda lakukan juga mencakup hal-hal yang tenang dengan baik dan jawaban oleh @ john dan @ joe keduanya relevan. Saya telah menyertakan tautan di bawah ini yang memberikan beberapa panduan lebih lanjut tentang pemblokiran mesin pencari. Satu-satunya cara saya dapat berpikir untuk sepenuhnya memblokir situs adalah dengan menambahkan beberapa bentuk perlindungan kata sandi di depan situs yang perlu diselesaikan sebelum konten ditampilkan.
SEOMoz kiat untuk tidak muncul dalam pencarian
sumber