Apakah Tes Turing, atau salah satu variannya, merupakan tes kecerdasan buatan yang andal?

35

The Turing Uji adalah tes pertama dari kecerdasan buatan dan sekarang sedikit usang. The Jumlah Turing Uji bertujuan untuk menjadi tes yang lebih modern yang membutuhkan sistem yang jauh lebih canggih. Teknik apa yang bisa kita gunakan untuk mengidentifikasi kecerdasan buatan (AI lemah) dan kecerdasan umum buatan (AI kuat)?

Rob Murray
sumber
6
Tentunya membutuhkan pendekatan statistik dengan sejumlah peserta. Saya sudah bertemu beberapa manusia yang tidak lulus Tes Turing.
SF.
1
Itu tergantung pada apa yang Anda definisikan sebagai kecerdasan.
baranskistad

Jawaban:

16

Poin retoris dari Tes Turing adalah bahwa tes ini menempatkan 'ujian' untuk 'kemanusiaan' dalam hasil yang dapat diamati , alih-alih dalam komponen internal . Jika Anda akan berperilaku sama dalam berinteraksi dengan AI seperti halnya dengan seseorang, bagaimana Anda bisa tahu perbedaan di antara mereka?

Tetapi itu tidak berarti itu dapat diandalkan, karena kecerdasan memiliki banyak komponen yang berbeda dan ada banyak jenis tugas intelektual. Turing Test, dalam beberapa hal, adalah tentang reaksi orang terhadap perilaku, yang sama sekali tidak dapat diandalkan - ingat bahwa banyak orang berpikir ELIZA , obrolan yang sangat sederhana, adalah pendengar yang sangat baik dan terlibat secara emosional dengan sangat cepat. Ini mengingatkan kita pada iklan Ikea tentang melempar lampu , di mana keterikatan emosional datang dari pemirsa manusia (dan musik), bukan dari lampu.

Tes Turing untuk kegiatan ekonomi tertentu jauh lebih menarik secara praktis - jika seseorang dapat menulis AI yang menggantikan driver Uber, misalnya, apa yang akan menyiratkannya jauh lebih jelas daripada jika seseorang dapat membuat chatbot percakapan.

Matthew Graves
sumber
10

Masalah dari Tes Turing adalah bahwa ia menguji kemampuan mesin untuk menyerupai manusia. Belum tentu setiap bentuk AI harus menyerupai manusia. Ini membuat Tes Turing kurang dapat diandalkan. Namun, ini masih berguna karena ini adalah tes yang sebenarnya. Juga patut dicatat bahwa ada hadiah untuk lulus atau datang paling dekat dengan lulus Tes Turing, Hadiah Loebner .

Definisi agen intelijen tentang intelijen menyatakan bahwa agen cerdas jika bertindak demikian untuk memaksimalkan nilai yang diharapkan dari ukuran kinerja berdasarkan pengalaman dan pengetahuan sebelumnya. (diparafrasekan dari Wikipedia ). Definisi ini digunakan lebih sering dan tidak tergantung pada kemampuan menyerupai manusia. Namun, lebih sulit untuk menguji ini.

Wythagoras
sumber
7

Tes Turing klasik tentu memiliki keterbatasan. Karena saya belum melihatnya disebutkan di sini, saya akan menyarankan Anda membaca tentang The Chinese Room , yang merupakan salah satu alasan yang paling sering dikutip mengapa Tes Turing memang gagal memastikan 'kesadaran' yang sebenarnya. Namun, saya juga mencatat bahwa Turing sendiri, dalam makalah asli yang mengusulkan Tes Turing , secara eksplisit mengakui bahwa tes itu bukan tes untuk mendeteksi kesadaran :

Saya mengusulkan untuk mempertimbangkan pertanyaan, "Bisakah mesin berpikir?" Ini harus dimulai dengan definisi makna istilah "mesin" dan "berpikir." Definisi dapat dibingkai sehingga mencerminkan sejauh mungkin penggunaan normal kata-kata, tetapi sikap ini berbahaya, Jika makna dari kata "mesin" dan "berpikir" dapat ditemukan dengan memeriksa bagaimana mereka biasa digunakan sulit untuk lolos dari kesimpulan bahwa makna dan jawaban untuk pertanyaan, "Bisakah mesin berpikir?" harus dicari dalam survei statistik seperti jajak pendapat Gallup. Tapi ini tidak masuk akal. Alih-alih mencoba definisi seperti itu saya akan mengganti pertanyaan dengan yang lain, yang terkait erat dengannya dan diekspresikan dalam kata-kata yang relatif tidak ambigu.

Bentuk masalah yang baru dapat dijelaskan dalam bentuk game yang kami sebut 'game imitasi. "

Game imitasi ini adalah ujian yang sekarang kita kenal sekarang (dan juga inspirasi untuk nama film layar lebar yang dibintangi oleh Benedict Cumberbatch dan Keira Knightley).

eric.mitchell
sumber
1
Jawaban yang bagus Saya juga berbagi pendapat bahwa peralihan dari "Game Imitasi" ke "Tes Turing" telah menyebabkan beberapa kesalahpahaman yang mendalam tentang konsekuensi tersebut. (Pornbots lulus Tes Turing sepanjang waktu;)
DukeZhou
5

Ada banyak definisi Inteligensi Buatan di alam bebas. Semua definisi ini adalah bagian dari satu (atau lebih) area. Ada empat domain utama, dan gambar di bawah ini akan menjelaskan hal ini.

masukkan deskripsi gambar di sini



Turing Test berputar di sekitar sisi kiri kardinalitas, yang sebagian besar berkaitan dengan bagaimana manusia berpikir atau bertindak. Tetapi, kita tahu bahwa ini tidak semuanya. Turing Test tidak menawarkan banyak hal mengenai AI secara umum.
Turing Test, seperti yang dinyatakan dalam Wikipedia, dibuat untuk menguji mesin yang menunjukkan perilaku yang setara atau tidak dapat dibedakan dari perilaku manusia. Kecerdasan Buatan jauh lebih dari apa yang bisa dilakukan manusia atau bagaimana mereka bertindak. Ada banyak tindakan manusia yang dianggap tidak cerdas dan terkadang juga tidak manusiawi.
Argumen Kamar Cina berfokus pada sesuatu yang sangat penting dalam hal ini "Kesadaran vs Simulasi Kesadaran". John Searle berpendapat di sana bahwa adalah mungkin bagi mesin (atau manusia) untuk mengikuti sejumlah besar aturan yang telah ditentukan (algoritma), untuk menyelesaikan tugas, tanpa berpikir atau memiliki pikiran. AI yang lemah pandai mensimulasikan kemampuan untuk memahami tetapi, tidak benar-benar mengerti apa yang mereka lakukan. Mereka tidak menunjukkan "Kesadaran Diri" dan tidak membentuk representasi tentang diri mereka sendiri. "Aku menginginkan itu, aku tahu aku menginginkan itu" adalah dua hal yang berbeda.

Seperti yang dinyatakan oleh Theory of Mind, AI yang baik seharusnya tidak hanya membentuk representasi tentang dunia yang sedang dikerjakannya, tetapi juga tentang agen dan entitas lain di dunia. Dua konsep kesadaran diri dan teori pikiran ini menarik garis tipis antara AI lemah dan kuat.

Ketika datang ke Tes Turing, itu gagal pada banyak alasan dan begitu juga Total Turing Test, yang menambahkan lapisan lain untuk tes. Sebagian besar peneliti percaya bahwa Turing Test hanyalah selingan dari tujuan utama, sesuatu yang menghalangi mereka dari pekerjaan yang bermanfaat. Pertimbangkan ini, misalkan Anda menanyakan masalah aritmatika yang sulit untuk membedakan antara manusia dan mesin. Jika mesin ingin berpura-pura itu manusia, maka ia akan berbohong. Ini bukan yang kita inginkan. Going for the Turing Test menetapkan batas atas ke AI yang dapat dibuat. Juga membuat AI bertindak dan berperilaku seperti manusia bukanlah ide yang sangat bagus. Manusia tidak pandai membuat keputusan yang benar setiap saat. Inilah alasan mengapa kita membaca tentang perang dalam buku sejarah kita. Keputusan yang kita buat seringkali bias, memiliki asal usul egois, dll. Kita tidak

Saya tidak berpikir ada satu tes untuk menguji AI. Ini karena AI memiliki banyak definisi, banyak tipe. Apakah AI lemah atau kuat dapat ditandai sambil mencari jawaban untuk pertanyaan seperti, "Saya ingin itu v / s saya tahu saya ingin itu", "Siapa saya dan apa yang sebenarnya saya lakukan (dari perspektif mesin)", ditambah beberapa pertanyaan lain yang saya sebutkan di atas.

Ugnes
sumber
3

Tergantung bagaimana tes diberikan. Misalnya, ketika orang mengklaim bahwa sebuah mesin telah berhasil lulus Turing Test beberapa tahun yang lalu, kriterianya cukup lemah. Itu hanya harus menipu 30% orang selama 5 menit. Itu tidak banyak ujian. Untuk menempatkan ini dalam perspektif Anda mungkin tidak akan mendeteksi skizofrenia, autisme, ketidakmampuan belajar, atau demensia dengan kriteria ini.

Terlepas dari hype, AI saat ini dapat dideteksi 100% dari waktu menggunakan pertanyaan yang cukup sederhana.

ilmiah
sumber
Poin bagus. "Diberi cukup banyak pertanyaan ..." (Tentu saja, pada tes Voight-Kampff tampaknya cukup efektif dengan sejumlah pertanyaan;)
DukeZhou
2

Apakah Tes Turing, atau salah satu variannya, merupakan tes kecerdasan buatan yang andal?

Lamur

Ya, jika seseorang mendefinisikan istilah Inteligensi Buatan dalam hal Game Imitasi Alan Turing atau salah satu variannya. Pendekatannya mungkin, pada saat yang sama, valid dan sangat terbatas sebagai definisi kecerdasan ketika orang menafsirkan kata sebelum AI muncul.

Kecerdasan Terbukti

Akibatnya, ada sejumlah besar pendekatan alternatif untuk mengukur kecerdasan, buatan atau sebaliknya.

  • Menjadi grand master catur
  • Membuat program catur yang unggul
  • Menerima penghargaan internasional yang sangat selektif
  • Menciptakan strategi yang memenangkan perang atau perdamaian
  • Mengatasi ribuan putaran eliminasi dalam bisnis atau politik untuk menjadi Presiden
  • Menulis artikel, makalah, skenario, ceramah, pidato, buku, atau puisi brilian yang menghasilkan pergeseran paradigma manusia yang signifikan
  • Menampilkan hasil level genius dalam tes Mensa
  • Menjadi salah satu orang paling kaya di dunia

Pengukuran Normal Kecerdasan Normal

Tapi ini adalah pengukuran kecerdasan luar biasa dari beberapa jenis, sebagian besar karena para pemimpin di bidang ini telah andal menerapkan kecerdasan pada banyak domain dengan cara sedemikian rupa yang mengarah pada kesuksesan luar biasa melalui berbagai skenario kehidupan nyata. Reliabilitas adalah atribut dari orang yang memiliki kecerdasan, bukan tes kecerdasan itu sendiri.

Ini lebih bersifat duniawi, namun mungkin lebih valid dan dapat diandalkan, ukuran kecerdasan.

  • Membesarkan anak-anak yang sehat dan penuh kasih dapat diverifikasi melalui wawancara yang cermat dari teman-teman dan rekan-rekan anggota keluarga
  • Penyembuhan berulang dan berhasil dari banyak kondisi dari berbagai jenis yang pernah diidentifikasi sebagai rusak dalam beberapa cara nyata dan terukur dan ditemukan dapat diperbaiki secara terukur sebagai hasil dari penerapan pemahaman intelijen, analisis, dan tindakan perbaikan.
  • Kecerdasan percakapan dapat diukur melalui peserta dalam percakapan yang menghubungkan keberhasilan mereka sendiri dengan ide-ide dan contoh-contoh yang ditetapkan oleh pembicara

Apa Tujuan Akhir yang Benar-Benar Diinginkan?

Mungkin karakteristik utama dari Tes Turing adalah bahwa itu buatan. Jika kecerdasan buatan adalah apa yang kita inginkan dari perangkat lunak AI, maka itulah yang akan kita terima. Namun, kemungkinan kita menginginkan sesuatu yang jauh lebih banyak atau lebih sedikit.

Kami ingin lebih dari itu akan menyenangkan beberapa komputer bisa menjadi teman kami, mentor kami, dan karyawan yang tidak dibayar dengan kemampuan luar biasa yang mengarah pada kesuksesan pribadi kami dalam hal pendapatan, pengaruh, popularitas, atau warisan.

Kami ingin lebih sedikit karena kami ingin beberapa komputer melakukan tugas-tugas khusus domain dan tetap sebagai alat yang sepenuhnya patuh, mungkin dengan kepribadian dan kehangatan, seperti kapal atau perangkat kompleks lain yang kami berikan nama manusia, namun tanpa ketidakpastian kemampuan jangkauan jauh. kecerdasan manusia.

Douglas Daseeco
sumber