Ada beberapa halaman di situs web saya yang saya ingin agar pengguna dapat mengunjungi hanya jika saya memberinya URL.
Jika saya melarang satu halaman robots.txt
, mereka akan terlihat oleh siapa saja yang melihatnya.
Pertanyaan saya adalah: jika saya tidak menautkannya dari mana saja, atau setidaknya dari halaman yang diindeks, apakah mereka masih dapat dijangkau oleh crawler dengan cara tertentu?
sumber
Yah saya pikir Anda memiliki perayap yang baik yang membaca robots.txt dan mengikuti arahan. Dan satu lagi yang tidak mengikuti arahan.
Dan bagaimana Anda berencana untuk memberikan url ini? Melalui email, menggunakan Facebook atau Twitter? Semua layanan ini merayapi informasi yang Anda kirim. Email parse Gmail yang Anda terima untuk menyediakan iklan. Jadi, url Anda entah bagaimana akan dirayapi.
Beberapa orang menggunakan Google Toolbar (atau apa pun toolbar lain dari mesin pencari). Ada opsi (dicentang secara default jika saya ingat betul) yang memungkinkan bilah alat mengirim semua url yang Anda kunjungi ke Google. Ini adalah cara lain bagi Google untuk melihat web tersembunyi. Jadi, bahkan jika Anda mengatakan kepada orang tersebut untuk tidak membagikan url, secara implisit ia akan (berkat bilah alat).
Saya pikir kita dapat menemukan banyak kemungkinan lain.
Jadi, Anda dapat menambahkannya ke robots.txt tetapi juga memberikan meta tambahan seperti noindex, nofollow, dll.edit:
Saran w3d tentang robots.txt menurut saya bagus. Jadi jangan menambahkannya ke robots.txt dan berikan tag meta propre.
sumber
Selain komentar di atas, saya akan memuji otentikasi HTACCESS sebagai minimum juga - dengan cara itu Anda dapat memberikan individu kombinasi nama pengguna / kata sandi selama durasi hak mereka untuk melihat halaman
Jika ada sesuatu dengan masalah privasi maka Anda perlu mempertimbangkan skrip kontrol masuk yang tepat.
Halaman yang tidak dilindungi (tidak peduli seberapa tersembunyi Anda pikir itu mungkin) akan membuatnya menjadi liar.
sumber