Adakah teknik modern menghasilkan CAPTCHA tekstual (sehingga orang perlu mengetik teks yang tepat) tantangan yang dapat dengan mudah menipu AI dengan beberapa metode kebingungan visual, tetapi pada saat yang sama manusia dapat menyelesaikannya tanpa kesulitan?
Misalnya saya sedang berbicara tentang kemampuan sederhana mengenali teks yang disematkan ke dalam gambar (tanpa mempertimbangkan plugin eksternal seperti flash atau java, klasifikasi gambar, dll.) Dan mengetik ulang teks yang telah ditulis atau sesuatu yang serupa.
Saya kira menambahkan noise, gradien, memutar huruf atau mengubah warna bukan metode yang dapat diandalkan lagi, karena mereka dapat dengan cepat rusak.
Adakah saran atau penelitian yang telah dilakukan?
image-recognition
research
ocr
kenorb
sumber
sumber
Jawaban:
Ini pertanyaan menarik tentang apa yang membuat manusia unik. Ada buku bagus tentang subjek yang berjudul What Computers Cant Do oleh Hubert Dreyfus .
Satu tugas yang tidak bisa ditangani oleh komputer (setidaknya untuk saat ini) adalah menentukan peringkat hal-hal penting. Sebagai contoh, CAPTCHA meminta Anda untuk memesan daftar hal-hal acak (item kecil, lima atau enam) berdasarkan kepentingan. Latihan khusus ini membutuhkan AI untuk mengambil keputusan (tidak selalu rasional) berdasarkan penilaian manusia.
sumber
Sebuah metode yang mungkin bisa digunakan adalah memanfaatkan ilusi optik seperti satu di mana dua garis di lorong identik tetapi satu tampaknya lebih panjang untuk mata manusia, maka mereka dapat diminta dengan pertanyaan pilihan ganda seperti keadaan garis, yang mana untuk mata kita terlihat lebih panjang, tetapi untuk komputer, masih panjang garis yang sama. Tentu saja, selalu ada masalah penyandang cacat berbasis mata yang tidak dapat menyelesaikannya, tetapi ilusi yang berbeda dapat digunakan untuk mengakomodasi hal itu.
Contoh
sumber
Mintalah label pengguna menyorot objek dalam video yang tidak dapat dipecahkan oleh penggolong canggih
Buat penggolong video canggih. Lebih baik latih saja tentang data pelatihan video YouTube-8M Google . Tetapi Anda juga ingin terus memberinya video asli.
Memiliki label classifier objek sebanyak mungkin. Mintalah mengisolasi objek mana yang dapat dikenali sebagai objek tetapi tidak dapat diberi label.
Apakah itu menghasilkan video yang menguraikan objek. Lebih disukai GIF, yang dapat dengan mudah disematkan dalam bentuk.
Untuk 100 di antaranya, tanyakan pada 100 pengguna apa objeknya. Jika 90% pengguna menyetujui nama objek, tambahkan video itu ke captcha-set. Sebut ini set pra-terlatih.
Setiap kali pengguna perlu mengautentikasi, perlihatkan kepada mereka salah satu objek yang disorot dalam video bukan dari set yang telah dilatih sebelumnya . Jika gambar memiliki kurang dari 100 pertunjukan, rekam label dan berikan lagi kepada pengguna dari set yang telah dilatih sebelumnya. Jika mereka melakukannya dengan benar, biarkan mereka melewatinya, jika tidak, berikan mereka yang lain dari set sebelumnya.
Setelah video yang tidak dilatih sebelumnya memiliki lebih dari 100 pertunjukan dan lebih dari 90% pengguna captcha setuju, tambahkan video itu ke perangkat pasca-pelatihan.
Seiring waktu, perlahan-lahan menghapus set pra-dilatih. Masukkan kadaluwarsa pada setiap video di set pasca-pelatihan dan hapus setelah kadaluwarsa, sehingga tidak sering digunakan.
Idealnya, proses ini akan terus meningkatkan classifier video, menjaganya agar tetap mutakhir dan sedikit di depan dari classifier lain. Mungkin itu juga dapat mendukung kata-kata dan objek yang kurang umum dan hal-hal yang lebih esoteris, sehingga spesialisasi pengklasifikasi ini terhadap pengklasifikasi lainnya.
Hal yang sama dapat dilakukan untuk pelabelan gambar, tetapi utilitas dari classifier video mungkin akan lebih lama, mengingat kemajuan dalam AI.
Sebenarnya, singkat dari beberapa tipu daya kuantum, tidak ada sistem captcha yang suatu hari tidak akan diselesaikan oleh sistem AI eksternal.
(sunting: oh, saya baru saja memperhatikan Anda secara khusus mengatakan "captcha tekstual." Tetapi secara teknis, input dalam sistem captcha yang dijelaskan di atas adalah tekstual.)
sumber