Mengapa di halaman pertama Google mengatakan ada ribuan hasil tetapi pada halaman terakhir ada kurang dari seratus?

11

Mengapa di halaman pertama Google mengatakan ada ribuan hasil tetapi pada halaman terakhir ada kurang dari seratus?

Itu semacam pencarian Google rekursif yang harus jelas. Butuh beberapa waktu untuk mengubah kalimat dan mencoba menemukan nomor yang sesuai, alasan mengapa saya mengubahnya menjadi " ratusan " sebagai gantinya! : P

Jika Anda telah menggunakan Google cukup lama, Anda tentu telah menemukan situasi yang mirip dengan ini, berkali-kali. Setiap kali menampilkan kurang dari 10 halaman, cukup mudah untuk melihatnya. Intinya adalah: jumlah hasil pada halaman mana pun kecuali yang terakhir tampak seperti perkiraan yang mengerikan .

Apa yang lebih aneh lagi, beberapa kali perkiraan acak tiba-tiba menjadi jauh lebih baik dan hampir persis sama di semua halaman daripada di halaman terakhir - satu-satunya halaman yang selalu benar.

Jadi, ada yang tahu kenapa?

cregox
sumber
1
Sekarang pada halaman satu untuk pencarian itu dikatakan 3200 hasil, tetapi pada halaman terakhir ia mengatakan 75 (untuk orang-orang yang tertarik pada pembaruan)
dkuntz2
@Duntuntz 2990 dan 65 untuk saya (saat saya masuk) sementara jika saya keluar (yang adalah bagaimana saya melakukannya pertama kali) itu berubah menjadi 3120 dan 77. Mungkin nanti saya akan mengubah pertanyaan sedikit dan membangun sebuah permintaan rekursif yang lebih konsisten - tetapi siapa pun boleh melakukannya juga! : P
cregox
Google itu aneh.
dkuntz2
Tambang saya selalu mengatakan 208 hasil pada halaman terakhir apakah itu 4 halaman hasil atau 22, selalu dikatakan 208.
mchid
Lihat juga searchengineland.com/…
1110101001

Jawaban:

6

Saya tidak tahu jawaban pastinya - mungkin tidak ada orang di luar Google yang tahu. Tapi saya punya dua titik data yang mungkin berguna.

Yang pertama adalah pandangan XKCD tentang masalah ini:

Jadi sepertinya ada ambang tertentu volume hasil di luar yang tampaknya Google katakan "sekrupkan" dan buang angka raksasa. Saya membayangkan ini mungkin karena ketidakmampuan daripada penipuan yang disengaja; Saya yakin sulit untuk menghasilkan halaman dengan cepat dari banyak sumber, dan mungkin untuk pencarian dengan banyak hasil mereka tidak punya waktu untuk menyelesaikannya semua. Jadi mereka menipu angka-angkanya. Fakta bahwa ini membuatnya terlihat seperti mereka memiliki hasil yang jauh lebih banyak daripada yang mereka lakukan mungkin adalah bonus yang tidak disengaja.

Poin data kedua adalah dari seorang profesor ilmu komputer yang saya punya yang cukup ingin tahu tentang masalah ini dan mengganggu beberapa teman di Google tentang hal itu. Mereka mengatakan kepadanya bahwa kadang-kadang menjadi sangat mahal untuk mencari tahu berapa banyak hasil yang benar-benar dikembalikan dari pencarian, jadi mereka hanya membuat tebakan terbaik dan mengembalikan halaman hasil pertama, yang semua orang pedulikan. Hanya ketika Anda benar-benar mulai menelusuri halaman-halamannya, Google tidak perlu repot-repot menghitung halaman yang tersisa.

Jadi tidak satu pun dari ini adalah jawaban yang pasti, tetapi mudah-mudahan mereka akan berguna dalam menjelaskan jenis masalah yang mungkin menyebabkan ketidakakuratan Google.

EDIT:

Jawabannya Sathya pada halaman ini memiliki jawaban dari Google 's Webmaster KB.

Ketika Anda melakukan pencarian, hasilnya sering ditampilkan dengan informasi: Hasil 1 - 10 dari tentang XXXX.

Perhitungan Google dari jumlah total hasil pencarian adalah perkiraan. Kami memahami bahwa angka rata-rata sangat berharga, dan dengan memberikan perkiraan daripada akun yang tepat, kami dapat mengembalikan hasil penelusuran berkualitas lebih cepat.

Selain itu, ketika Anda mengklik halaman hasil pencarian berikutnya, jumlah total hasil pencarian dapat berubah. Dalam hal ini, kami menyadari bahwa beberapa hasil kueri adalah duplikat, dan pisahkan duplikat tersebut sehingga Anda dapat menemukan hasil spesifik yang Anda cari dengan lebih mudah. Mengurangi duplikat akan mengurangi taksiran jumlah hasil, dan juga jumlah keseluruhan halaman hasil.

dsolimano
sumber
Sementara saya menyukai XKCD dan mantan guru yang terkasih, apa yang Anda katakan kepada saya adalah bahwa saya mungkin harus menanyakan ini di stackoverflow.com: P
cregox
Saya tidak berpikir siapa pun di stackoverflow akan memiliki jawaban yang pasti - jika Anda benar-benar perlu tahu, Anda harus bertanya kepada Google. Saya hanya dapat menyampaikan jawaban dari seseorang yang bertanya kepada Google beberapa bulan yang lalu.
dsolimano
tidak mencari jawaban yang pasti, hanya satu dengan penjelasan yang lebih masuk akal, lebih baik yang bersumber. Jangan salah paham, itu masuk akal, tetapi mengatakan "karena sulit" walaupun itu berwibawa dan masuk akal, terlalu sedikit bagi saya. Hmm ... mungkin
skeptis.se
Edit yang bagus, sekarang sumber yang bagus! Meskipun masih mengatakan "karena sulit", yang berarti saya masih berharap untuk detail lebih lanjut. : P
cregox
7

Tidak - jumlahnya hanyalah perkiraan .

Ketika Anda melakukan pencarian, hasilnya sering ditampilkan dengan informasi: Hasil 1 - 10 dari tentang XXXX.

Perhitungan Google dari jumlah total hasil pencarian adalah perkiraan. Kami memahami bahwa angka rata-rata sangat berharga, dan dengan memberikan perkiraan daripada akun yang tepat, kami dapat mengembalikan hasil penelusuran berkualitas lebih cepat.

Selain itu, ketika Anda mengklik halaman hasil pencarian berikutnya, jumlah total hasil pencarian dapat berubah. Dalam hal ini, kami menyadari bahwa beberapa hasil kueri adalah duplikat, dan pisahkan duplikat tersebut sehingga Anda dapat menemukan hasil spesifik yang Anda cari dengan lebih mudah. Mengurangi duplikat akan mengurangi taksiran jumlah hasil, dan juga jumlah keseluruhan halaman hasil.

Sathyajith Bhat
sumber
Saya pikir ini bukan perilaku yang baik jika mereka selalu membatasi jumlah hasil menjadi kurang lebih 1000 saja. Dalam hal pengguna ingin lebih banyak mereka harus menunjukkan lebih banyak. Dalam pandangan saya, beberapa kata kunci umum harus mengembalikan hasil pencarian yang sangat besar (seperti bunga, buku ...) dan saya pikir banyak gambar yang berbeda ada di Internet!
@ user11656 Anda berasumsi bahwa Google Image Search bekerja dengan cara yang sama seperti pencarian di aplikasi standar yang mungkin Anda gunakan. Berbagai hal biasanya bekerja sangat berbeda pada skala itu. Kemungkinan tidak ada jawaban tunggal untuk "semua gambar yang cocok dengan bunga" karena server di Australia mungkin memiliki gambar yang baru diunggah yang belum disebarkan ke server di AS. Maka Anda harus berurusan dengan hal-hal seperti bagaimana menyajikan duplikat, dan bagaimana melakukan semua itu di jutaan gambar untuk jutaan pengguna secara instan. Ini hal yang sulit dan Anda harus membuat kompromi arsitektur.
George Mauer
3

Hitungan hasil Google adalah metrik yang tidak berarti . Selain dari runtuh duplikat, Anda juga telah membendung, cara bahwa jumlah dihitung di tempat pertama dengan frekuensi mengalikan, dan fakta bahwa Google membebankan topi yang set jumlah maksimum hasil yang akan pernah dikembalikan.

JdeBP
sumber
2

Tidak ada jawaban di atas yang benar.

Perkiraan Google harus lebih dekat dengan jumlah hasil nyata daripada apa yang diberikan.

Ini dapat ditunjukkan dengan contoh sederhana. Pilih kata yang agak sering seperti "Rusia" atau "michael". Sebenarnya harus ada ribuan, jika tidak ratusan ribu, situs web di internet yang mengandung kata-kata itu di suatu tempat di situs mereka. Tetapi hasil Google mungkin hanya memberi Anda, katakanlah, 700.

Yang benar bukanlah bahwa Google memberikan perkiraan yang terlalu besar, tetapi bahwa sekarang Google sangat membatasi jumlah hasil yang akan diberikannya kepada Anda. Ini sangat mengurangi hasil, sehingga merugikan kita sebagai individu. Sangat disayangkan karena saya ingin membaca ribuan situs dengan istilah saya dalam beberapa kasus.

Saya tahu ini karena saya telah menggunakan Google untuk waktu yang lama, mungkin 10-15 tahun dan telah memperhatikan bahwa sebagai aturan umum, hasil untuk istilah semakin pendek, tidak lebih lama, walaupun jumlah situs dengan istilah yang sama umumnya harus telah meningkat pada saat saya telah menggunakan Google.

Padahal di masa lalu, tahun lalu saya mungkin bisa mendapatkan 1.000 hasil untuk beberapa istilah, sekarang saya mendapatkan 500 hasil untuk istilah yang sama dengan yang saya akan dapatkan 1000 hasil.

Rakovsky
sumber
2
Harap perhatikan bahwa "di atas" tidak memiliki konteks dalam jawaban, karena jawaban tersebut dapat diurutkan dengan beberapa cara berbeda. Bahkan jika Anda menganggap pengurutan standar dengan "suara", posisi mereka akan berubah ketika suara naik dan turun ditambahkan.
ale
Sangat menarik! Rusia memberi saya sekarang hanya 322 hasil dan itu hanya menunjukkan pada halaman 34 terakhir . Sampai saat itu akan mengatakan 799 000 hasil! Meskipun ini adalah wawasan yang bagus, itu masih tampak tidak benar. Saya tidak berpikir bahwa perkiraan pertama juga benar dan tujuannya hanya membawa hasil yang ditunjukkan, bukan "berapa banyak yang menurutnya ada di web", karenanya, halaman terakhir memperbaikinya.
cregox
1

Masalah dengan mesin pencari Google (Gambar) adalah bahwa ia bertujuan untuk relevansi dengan menjatuhkan varian. Pertama, penting untuk memahami cara kerjanya. Gambar yang diunggah ke internet perlu diindeks dengan dua cara:

  • berdasarkan orisinalitas (gambar dapat dianalisis oleh "bot pintar" berdasarkan warna, ukuran, pola, pengenalan bentuk, jenis, dll.)
  • berdasarkan kesamaan (gambar dapat dianalisis dengan "bot2 pintar" dan direferensikan silang dengan gambar yang sudah ada dalam database dan selanjutnya ditandai dengan satu atau dua label kategori: "gambar cocok" dan "gambar mirip dengan ... ")

Setelah pengindeksan selesai, gambar akan mewarisi "kata kunci" sebagai hasil pengakuan untuk menghindari menampilkan hasil di luar topik kepada pengguna akhir. Masalahnya adalah bahwa setiap kata kunci adalah frasa mandiri dengan nilai yang ditetapkan dalam% berdasarkan pada kekuatan relevansi (itu sebabnya pengelompokan lebih banyak kata di kotak pencarian menghasilkan lebih sedikit hasil dan juga ketika Anda mencari gambar dengan mengunggahnya atau memasukkan URL, Google akan menetapkan "tebak" hanya dengan kata kunci teratas, yang berarti bahwa pencarian tidak akan pernah menampilkan semua gambar hanya karena pencarian tidak dirancang untuk melakukannya)

Jadi pada akhir hari ketika Anda melakukan pencarian gambar dan tepat di bawah kotak pencarian, Anda akan melihat angka yang luar biasa mengatakan "25.270.000.000 hasil (0,55 detik)" yang sebagian besar selalu berupa nomor palsu, karena Anda tidak akan mendapatkan lagi dari 200 (maks 500 tetapi hanya setelah pengguna memintanya) hasil yang juga difilter untuk mengecualikan:

  • duplikat eksternal (jika gambar yang sama adalah 2+ kali pada halaman situs yang sama)
  • duplikat relevansi (hanya menampilkan "hasil terbaik" - lihat gambar di bawah)
  • gambar yang memiliki masalah dengan hukum (lihat gambar di bawah)
  • gambar yang melanggar DMCA (lihat gambar di bawah)
  • gambar yang berasal dari sumber SPAM, MALWARE, PHISHING
  • gambar yang disembunyikan (jika pengguna tidak menonaktifkan Pencarian Aman)
  • gambar yang masuk daftar hitam oleh Google ( artikel )
  • gambar dengan AR yang berbeda (pada dasarnya semua gambar yang memiliki rasio aspek berbeda dari referensi pencarian gambar. mis. Anda dapat kehilangan semua hasil yang diinginkan jika Anda mencari berdasarkan gambar yang Anda pilih - katakanlah dengan rasio aneh 9: 7 - sementara semua gambar diindeks dalam Google dengan rasio 3: 4 - yang mungkin merupakan kerugian terbesar dari mesin pencari ini karena selalu mematuhi Rasio Aspek sebagai kriteria pertama)
  • dan banyak lagi

Untuk meringkasnya: hasil pencarian dari suatu gambar tidak pernah sepenuhnya relevan. Kadang-kadang Anda akan mendapatkan hasil akhir yang diinginkan dengan frasa pencarian "poster gerbang" jika tidak, itu bisa menjadi "penutup gerbang", "gerbang bluray", "gerbang dvd", "gerbang 2015" atau bahkan "自衛隊 彼 の 地 に て 斯 く く くえ り "- Anda tidak bisa mendapatkan hasil gambar" SEMUA ", karena tidak ada apa pun yang" SEMUA ", itu sebabnya ada kebutuhan untuk bermain dengannya untuk sampai ke sana. Dan juga relevan untuk menyebutkan, bahwa ada mesin pencari gambar lain yang dapat melakukan pekerjaan dengan cara yang lebih berbeda, karena mereka bekerja pada standar dan kriteria yang berbeda. Itu bukan dan tidak pernah menjadi "Google" -hanya ... >> https://www.yandex.com/images/

ekstensi penting:

pengguna0
sumber
Sekali lagi, menandai ini sebagai duplikat akan jauh lebih membantu daripada memposting jawaban pada setiap pertanyaan.
jonsca
0

Di bagian atas dikatakan halaman 70 dari 7000 hasil (contoh). Ini akan memberikan nomor halaman dan berapa banyak hasil. Tidak ada 70 hasil, tetapi 70 halaman. Semoga ini membantu.

Aaron Ford
sumber