Apakah Google mengirimkan formulir HTML?

10

Saya punya halaman web, katakan http://domain/purchasedan di halaman ini, saya punya formulir web. Pengguna, saat mengirimkan formulir ini (yang memiliki validasi, baik sisi klien dan sisi server dan tidak akan divalidasi sampai bidang diisi dengan tepat), akan diarahkan ke halaman lain, di mana ia dapat memilih hal-hal lain, dan menentukan pengaturan lain dan kemudian membeli produk kami. Katakan halaman kedua adalah http://domain/options.

Jadi, pengguna datang ke situs kami dan mengunjungi http://domain/purchase, mengisi formulir, mengirimkannya, dan kemudian akan diarahkan ke halaman kedua http://doamin/options?parameter1=value1&parameter2=value2, yang berisi parameter dari halaman pertama. Ini sangat umum dalam melewati parameter antara halaman web (atau secara teknis, antara URL).

Sekarang saya sedang meninjau situs web saya, dan melihat bahwa Google telah mengindeks beberapa halaman web dan URL saya yang dialihkan, seperti:

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

Ini berarti bahwa Google Bot telah mengunjungi http://domain/purchasehalaman kami , dan telah mengisi formulir kami, dan telah mengirimkannya, dan sedang diarahkan ke URL lain, dengan parameter yang sesuai. Ini satu-satunya cara yang masuk akal bagi saya. Apakah Google benar-benar mengisi formulir?

PS: Semua parameter bermakna, artinya tidak diisi semena-mena. Misalnya, parameter telepon di halaman yang diindeks memiliki nomor telepon yang benar. Bagaimana itu mungkin?

Saeed Neamati
sumber

Jawaban:

8

Google telah dapat merayapi formulir HTML sejak 2008 .

Setelah memilih nilai untuk setiap input, kami menghasilkan dan kemudian mencoba merayapi URL yang sesuai dengan permintaan yang mungkin dibuat pengguna. Jika kami memastikan bahwa halaman web yang dihasilkan dari permintaan kami valid, menarik, dan termasuk konten yang tidak ada dalam indeks kami, kami dapat memasukkannya ke dalam indeks kami sama seperti kami akan memasukkan halaman web lainnya.

Di sisi lain, karena GoogleBot tidak mungkin mengetahui parameter yang benar untuk dimasukkan ke bidang tersebut, mungkin ada penjelasan lain. Apakah mungkin pengguna Anda menautkan ke halaman yang dialihkan?

Kat
sumber
Video Google Webmaster ini juga membahas kedua poin: youtube.com/watch?v=xS0oHYZafTQ
DisgruntledGoat
Dikatakan bahwa mereka hanya merayapi formulir GET . Metode formulir saya adalah POST . Jadi, tidak berlaku. Ya, mengapa tidak, URL selalu dapat terhubung dengan tautan.
Saeed Neamati
5
Jika Anda melihat ?parameter1=value9&parameter2=value10di URL, mereka MENDAPATKANnya; POST tidak menanamkan variabel bentuk di URL.
Wooble
@ Woobie: Dalam hal ini parameter URL tampaknya merupakan hasil dari pengalihan sisi server, setelah formulir POST'd.
MrWhite
4

Google semakin agresif ketika mengirim formulir.

John Conde
sumber
Kuncinya adalah: "Kami telah memulai percobaan untuk menulis ulang permintaan POST ke GET";)
Zhaph - Ben Duguid