Dari apa yang saya pahami, Captcha adalah teks yang telah terdistorsi oleh aplikasi filter, noise, dan algoritma lainnya yang keliru. Oleh karena itu, untuk mengetahui apakah kemampuan membaca orang tersebut adalah kemampuan seseorang, Anda membandingkan jawaban mereka dengan jawaban yang diketahui.
Sekarang, membaca di ReCaptcha, dikatakan bahwa kata-kata yang ditampilkan adalah yang tidak dapat diterjemahkan oleh OCR. Selain itu, recaptcha sedang digunakan untuk menerjemahkan gambar-gambar itu. Bagaimana ia bisa tahu apakah Anda memang benar dalam membaca atau hanya mengada-ada?
Jika tahu apa yang dikatakannya, itu tidak akan digunakan dalam recaptcha sebagai bahan terjemahan. Jika tidak tahu apa yang dikatakan teks, lalu bagaimana cara memvalidasi jawaban Anda?
Saya menduga ini mungkin beberapa analisis berbasis probabilitas dengan ukuran sampel besar sebelum menandai apa pun yang diterjemahkan.
Adakah yang tahu di mana jawabannya?
Jawaban:
Halaman buku pada dasarnya dipindai secara fotografis, dan kemudian diubah menjadi teks menggunakan "Pengenalan Karakter Optik" (OCR) dan diumpankan ke web dalam bentuk gambar dengan satu kata yang dikenal dengan program komputer di belakang reCAPTCHA dan satu kata yang tidak belum diketahui.
Pengguna kemudian mengetik kedua kata keluar dan jika mereka memecahkan yang jawabannya diketahui, sistem menganggap jawaban mereka benar untuk yang baru. Sistem kemudian memberikan gambar baru kepada sejumlah orang lain untuk menentukan, dengan kepercayaan yang lebih tinggi, apakah jawaban aslinya benar. Oleh karena itu, sistem ini adalah layanan peningkatan diri yang semakin baik seiring berjalannya waktu.
http://www.google.com/recaptcha/learnmore
sumber
Inilah sebabnya mengapa reCaptcha membuat Anda memasukkan dua kata. Salah satu kata sudah dikenal, dan salah satu kata tidak dikenal. Apakah Anda lulus atau gagal captcha hanya tergantung pada bagaimana Anda menjawab kata yang dikenal. Jawaban Anda untuk kata (tidak dikenal) lainnya akan digunakan, bersama dengan tanggapan lain untuk kata yang sama, untuk mengubahnya menjadi kata yang dikenal juga.
sumber