Saat menggunakan pemeriksa tautan W3C , saya menemukan bahwa Github Wiki saya tidak dapat dirayapi:
https://github.com/aegif/CmisSync/wiki/Getting-started-with-CmisSync-development
Status: (T / A) Dilarang oleh robots.txt
Ini sangat disayangkan, karena saya ingin orang-orang dengan mudah menemukan Wiki ini di mesin pencari.
PERTANYAAN: Bagaimana cara membuat Github Wiki saya dapat dijelajahi oleh mesin pencari?
Atau apakah saya salah dan robots.txt Github sebenarnya OK?
Jawaban:
GitHub robots.txt tidak secara eksplisit melarang perayapan halaman wiki, misalnya di bagian Googlebot:
Karena ini adalah file robot di seluruh situs, tidak ada gunanya mengelak.
Ini adalah pilihan yang menarik, karena GitHub menggambarkan wiki sebagai tempat untuk "berbagi konten bentuk panjang tentang proyek Anda". Karena wiki publik default dapat diedit oleh pengguna mana pun, mungkin itu adalah perlindungan berat dari spammer.
sumber
Wiki GitHub dapat dicari oleh mesin yang mendukungnya. Lihat dua baris pertama https://github.com/robots.txt :
Itu mungkin untuk parsing berbagai format wiki dll.
Misalnya mencari di Google untuk "protokol broker openrefine" dan klik pertama adalah halaman di bawah wiki proyek Github.
sumber