Apakah Tes Turing, atau salah satu variannya, merupakan tes kecerdasan buatan yang andal?

35

The Turing Uji adalah tes pertama dari kecerdasan buatan dan sekarang sedikit usang. The Jumlah Turing Uji bertujuan untuk menjadi tes yang lebih modern yang membutuhkan sistem yang jauh lebih canggih. Teknik apa yang bisa kita gunakan untuk mengidentifikasi kecerdasan buatan (AI lemah) dan kecerdasan umum buatan (AI kuat)?

turing-test strong-ai intelligent-agent weak-ai Rob Murray
sumber

6

Tentunya membutuhkan pendekatan statistik dengan sejumlah peserta. Saya sudah bertemu beberapa manusia yang tidak lulus Tes Turing.

SF.

1

Itu tergantung pada apa yang Anda definisikan sebagai kecerdasan.

baranskistad

16

Poin retoris dari Tes Turing adalah bahwa tes ini menempatkan 'ujian' untuk 'kemanusiaan' dalam hasil yang dapat diamati , alih-alih dalam komponen internal . Jika Anda akan berperilaku sama dalam berinteraksi dengan AI seperti halnya dengan seseorang, bagaimana Anda bisa tahu perbedaan di antara mereka?

Tetapi itu tidak berarti itu dapat diandalkan, karena kecerdasan memiliki banyak komponen yang berbeda dan ada banyak jenis tugas intelektual. Turing Test, dalam beberapa hal, adalah tentang reaksi orang terhadap perilaku, yang sama sekali tidak dapat diandalkan - ingat bahwa banyak orang berpikir ELIZA , obrolan yang sangat sederhana, adalah pendengar yang sangat baik dan terlibat secara emosional dengan sangat cepat. Ini mengingatkan kita pada iklan Ikea tentang melempar lampu , di mana keterikatan emosional datang dari pemirsa manusia (dan musik), bukan dari lampu.

Tes Turing untuk kegiatan ekonomi tertentu jauh lebih menarik secara praktis - jika seseorang dapat menulis AI yang menggantikan driver Uber, misalnya, apa yang akan menyiratkannya jauh lebih jelas daripada jika seseorang dapat membuat chatbot percakapan.

Matthew Graves
sumber

10

Masalah dari Tes Turing adalah bahwa ia menguji kemampuan mesin untuk menyerupai manusia. Belum tentu setiap bentuk AI harus menyerupai manusia. Ini membuat Tes Turing kurang dapat diandalkan. Namun, ini masih berguna karena ini adalah tes yang sebenarnya. Juga patut dicatat bahwa ada hadiah untuk lulus atau datang paling dekat dengan lulus Tes Turing, Hadiah Loebner .

Definisi agen intelijen tentang intelijen menyatakan bahwa agen cerdas jika bertindak demikian untuk memaksimalkan nilai yang diharapkan dari ukuran kinerja berdasarkan pengalaman dan pengetahuan sebelumnya. (diparafrasekan dari Wikipedia ). Definisi ini digunakan lebih sering dan tidak tergantung pada kemampuan menyerupai manusia. Namun, lebih sulit untuk menguji ini.

Wythagoras
sumber

7

Tes Turing klasik tentu memiliki keterbatasan. Karena saya belum melihatnya disebutkan di sini, saya akan menyarankan Anda membaca tentang The Chinese Room , yang merupakan salah satu alasan yang paling sering dikutip mengapa Tes Turing memang gagal memastikan 'kesadaran' yang sebenarnya. Namun, saya juga mencatat bahwa Turing sendiri, dalam makalah asli yang mengusulkan Tes Turing , secara eksplisit mengakui bahwa tes itu bukan tes untuk mendeteksi kesadaran :

Saya mengusulkan untuk mempertimbangkan pertanyaan, "Bisakah mesin berpikir?" Ini harus dimulai dengan definisi makna istilah "mesin" dan "berpikir." Definisi dapat dibingkai sehingga mencerminkan sejauh mungkin penggunaan normal kata-kata, tetapi sikap ini berbahaya, Jika makna dari kata "mesin" dan "berpikir" dapat ditemukan dengan memeriksa bagaimana mereka biasa digunakan sulit untuk lolos dari kesimpulan bahwa makna dan jawaban untuk pertanyaan, "Bisakah mesin berpikir?" harus dicari dalam survei statistik seperti jajak pendapat Gallup. Tapi ini tidak masuk akal. Alih-alih mencoba definisi seperti itu saya akan mengganti pertanyaan dengan yang lain, yang terkait erat dengannya dan diekspresikan dalam kata-kata yang relatif tidak ambigu.

Bentuk masalah yang baru dapat dijelaskan dalam bentuk game yang kami sebut 'game imitasi. "

Game imitasi ini adalah ujian yang sekarang kita kenal sekarang (dan juga inspirasi untuk nama film layar lebar yang dibintangi oleh Benedict Cumberbatch dan Keira Knightley).

eric.mitchell
sumber

1

Jawaban yang bagus Saya juga berbagi pendapat bahwa peralihan dari "Game Imitasi" ke "Tes Turing" telah menyebabkan beberapa kesalahpahaman yang mendalam tentang konsekuensi tersebut. (Pornbots lulus Tes Turing sepanjang waktu;)

DukeZhou

5

Ada banyak definisi Inteligensi Buatan di alam bebas. Semua definisi ini adalah bagian dari satu (atau lebih) area. Ada empat domain utama, dan gambar di bawah ini akan menjelaskan hal ini.

Turing Test berputar di sekitar sisi kiri kardinalitas, yang sebagian besar berkaitan dengan bagaimana manusia berpikir atau bertindak. Tetapi, kita tahu bahwa ini tidak semuanya. Turing Test tidak menawarkan banyak hal mengenai AI secara umum.
Turing Test, seperti yang dinyatakan dalam Wikipedia, dibuat untuk menguji mesin yang menunjukkan perilaku yang setara atau tidak dapat dibedakan dari perilaku manusia. Kecerdasan Buatan jauh lebih dari apa yang bisa dilakukan manusia atau bagaimana mereka bertindak. Ada banyak tindakan manusia yang dianggap tidak cerdas dan terkadang juga tidak manusiawi.
Argumen Kamar Cina berfokus pada sesuatu yang sangat penting dalam hal ini "Kesadaran vs Simulasi Kesadaran". John Searle berpendapat di sana bahwa adalah mungkin bagi mesin (atau manusia) untuk mengikuti sejumlah besar aturan yang telah ditentukan (algoritma), untuk menyelesaikan tugas, tanpa berpikir atau memiliki pikiran. AI yang lemah pandai mensimulasikan kemampuan untuk memahami tetapi, tidak benar-benar mengerti apa yang mereka lakukan. Mereka tidak menunjukkan "Kesadaran Diri" dan tidak membentuk representasi tentang diri mereka sendiri. "Aku menginginkan itu, aku tahu aku menginginkan itu" adalah dua hal yang berbeda.

Seperti yang dinyatakan oleh Theory of Mind, AI yang baik seharusnya tidak hanya membentuk representasi tentang dunia yang sedang dikerjakannya, tetapi juga tentang agen dan entitas lain di dunia. Dua konsep kesadaran diri dan teori pikiran ini menarik garis tipis antara AI lemah dan kuat.

Ketika datang ke Tes Turing, itu gagal pada banyak alasan dan begitu juga Total Turing Test, yang menambahkan lapisan lain untuk tes. Sebagian besar peneliti percaya bahwa Turing Test hanyalah selingan dari tujuan utama, sesuatu yang menghalangi mereka dari pekerjaan yang bermanfaat. Pertimbangkan ini, misalkan Anda menanyakan masalah aritmatika yang sulit untuk membedakan antara manusia dan mesin. Jika mesin ingin berpura-pura itu manusia, maka ia akan berbohong. Ini bukan yang kita inginkan. Going for the Turing Test menetapkan batas atas ke AI yang dapat dibuat. Juga membuat AI bertindak dan berperilaku seperti manusia bukanlah ide yang sangat bagus. Manusia tidak pandai membuat keputusan yang benar setiap saat. Inilah alasan mengapa kita membaca tentang perang dalam buku sejarah kita. Keputusan yang kita buat seringkali bias, memiliki asal usul egois, dll. Kita tidak

Saya tidak berpikir ada satu tes untuk menguji AI. Ini karena AI memiliki banyak definisi, banyak tipe. Apakah AI lemah atau kuat dapat ditandai sambil mencari jawaban untuk pertanyaan seperti, "Saya ingin itu v / s saya tahu saya ingin itu", "Siapa saya dan apa yang sebenarnya saya lakukan (dari perspektif mesin)", ditambah beberapa pertanyaan lain yang saya sebutkan di atas.

Ugnes
sumber

3

Tergantung bagaimana tes diberikan. Misalnya, ketika orang mengklaim bahwa sebuah mesin telah berhasil lulus Turing Test beberapa tahun yang lalu, kriterianya cukup lemah. Itu hanya harus menipu 30% orang selama 5 menit. Itu tidak banyak ujian. Untuk menempatkan ini dalam perspektif Anda mungkin tidak akan mendeteksi skizofrenia, autisme, ketidakmampuan belajar, atau demensia dengan kriteria ini.

Terlepas dari hype, AI saat ini dapat dideteksi 100% dari waktu menggunakan pertanyaan yang cukup sederhana.

ilmiah
sumber

Poin bagus. "Diberi cukup banyak pertanyaan ..." (Tentu saja, pada tes Voight-Kampff tampaknya cukup efektif dengan sejumlah pertanyaan;)