Google mengaku adil, dan kepentingan perusahaan (sebagian besar waktu) untuk menjelajahi Internet untuk apa pun dan segala sesuatu yang dapat diakses oleh laba-laba. Saya ingin tahu:
- Apa jenis konten (dapat diakses publik) yang gagal disampaikan oleh Google?
- Apakah ada jenis konten spesifik yang tidak bisa diambil Google?
Referensi, terutama untuk dokumentasi Google sendiri, akan sangat luar biasa.
google-search
samthebrand
sumber
sumber
Jawaban:
Beberapa ide tentang jenis hal:
robots.txt
file domain dikecualikan dari indeks Google.Pelajari lebih lanjut tentang Deep Web
sumber
Selain Twitter, Google tidak indeks Tumblr semua yang baik. Posting blog di Tumblr lebih mudah ditemukan menggunakan pencarian Tumblr. Juga semua yang ada di Situs Google tidak (atau hampir tidak) diindeks. Jika Anda memulai situs Google, dapatkan domain Anda sendiri.
Blog yang lebih kecil yang tidak diperbarui secara teratur sering kali dibuang dari hasil pencarian. Ditambah apa pun yang mereka anggap splog .
sumber
Yah, sebagian besar konten Twitter tidak diindeks oleh Google, meskipun itu publik. Dulu tersedia untuk Google, tetapi itu tidak lagi terjadi sejak perjanjian mereka berakhir.
Sumber .
sumber
Itu tergantung di negara mana Anda berada. Di Jerman tidak menunjukkan ribuan situs yang menurut pemerintah tidak baik untuk Anda, dan daftarnya bertambah ribuan setiap tahun.
Google adalah motor sensor internet. Jika Anda menginginkan Internet gratis, gunakan beberapa perusahaan yang tidak jahat, seperti DuckDuckGo atau yang lainnya.
sumber
Anda tidak dapat mencari kata kunci dengan karakter khusus di Google Search :
Ini sangat menjengkelkan ketika Google beberapa kode.
sumber
Google menghapus hasil pencarian yang dianggap melanggar hak kekayaan intelektual setelah DMCA take-down dan permintaan serupa. Lihat formulir permintaan penghapusan hasil pencarian Google (mungkin memiliki URL tambahan btw).
sumber
Situs dengan konten yang begitu banyak sehingga Google tidak punya waktu (atau kecenderungan) untuk mengindeks semuanya.
Situs yang tidak memiliki peta situs yang dapat dijelajahi dan mengharuskan Google untuk menyediakan istilah pencarian untuk mengakses hasil yang tersedia di situs mungkin tidak diindeks sepenuhnya.
sumber