Jika saya tidak ingin mengatur perilaku khusus, apakah boleh jika saya tidak repot-repot memiliki file robots.txt?
Atau dapatkah kekurangan satu itu berbahaya?
sumber
Jika saya tidak ingin mengatur perilaku khusus, apakah boleh jika saya tidak repot-repot memiliki file robots.txt?
Atau dapatkah kekurangan satu itu berbahaya?
Kekurangan file robots.txt tidak akan berbahaya. Dari situs web robotstxt.org :
Untuk memungkinkan semua robot menyelesaikan akses
Agen-pengguna: *
Larang:(atau cukup buat file "/robots.txt" kosong, atau jangan gunakan sama sekali)
Namun, bahkan jika Anda tidak menentukan apa pun di file robots.txt Anda, ini adalah cara yang baik untuk memberi tahu mesin pencari tentang lokasi XML Sitemap Anda . Anda dapat melakukan ini dengan menambahkan baris di bagian atas file robots.txt Anda yang terlihat seperti:
Anda juga harus menyadari bahwa tidak memilikinya akan membuat banyak 404 entri di log web Anda.
Jika Anda tidak memiliki "robots.txt" log kesalahan Anda akan mendapatkan banyak 404 pada file, yang bisa menjadi semacam gangguan, mirip dengan jika Anda tidak memiliki favicon.
sumber
robots.txt
file sederhana , yang juga akan diunduh lebih jarang karena mesin pencari menerapkan kontrol cache HTTP yang tepat .Saya pikir itu harus baik-baik saja, jika tidak petak besar web tidak dapat diindeks oleh laba-laba web.
Tidak
robots.txt
sama dengan "memungkinkan pengindeksan oleh semua orang"robots.txt
hampir secara definisi.sumber
Kurangnya file robots.txt menyerahkannya ke perayap untuk memutuskan apa yang bisa dan tidak bisa dilakukan. Karena hanya butuh beberapa detik untuk menghindari segala jenis ambiguitas, mengapa tidak membuat satu yang memungkinkan semua agen untuk mengakses semuanya?
sumber
Nah, karena
robots.txt
berisi alamat sitemap Anda , tidak memilikinya berpotensi membahayakan.sumber
Bergantung pada konten Anda, seharusnya tidak ada masalah dengan tidak memiliki file robot selama Anda ingin setiap halaman di situs Anda diindeks oleh mesin pencari.
sumber