Makna jaringan saraf sebagai kotak hitam?

19

Saya sering mendengar orang berbicara tentang jaringan saraf sebagai sesuatu yang tidak Anda mengerti apa artinya atau apa artinya. Sebenarnya saya tidak mengerti apa yang mereka maksud dengan itu! Jika Anda memahami cara kerja back-propagation, lalu bagaimana ini adalah kotak hitam?

Apakah itu berarti kita tidak mengerti bagaimana bobot yang dihitung atau apa?

Jack Twain
sumber
1
Mungkin ini akan membantu: colah.github.io/posts/2014-03-NN-Manifolds-Topology Artikel ini mencoba mengungkap mekanisme yang mendasari jaringan saraf dari perspektif topologi, ia menawarkan banyak wawasan brilian untuk menjelaskan kinerja jaringan saraf.
Sol
Saya suka menambahkan poin ke Jack, ketika kita melihat MLP dalam sudut pandang pembelajaran mesin, jaringan saraf bukan kotak hitam lagi. Dengan fungsi sigmoid sederhana kita akan dapat menginterpretasikan hubungan input dan out dengan suatu persamaan.

Jawaban:

37

Jaringan saraf adalah kotak hitam dalam arti bahwa meskipun dapat mendekati fungsi apa pun, mempelajari strukturnya tidak akan memberi Anda wawasan tentang struktur fungsi yang sedang didekati.

Sebagai contoh, satu penggunaan umum dari jaringan saraf pada bisnis perbankan adalah untuk mengklasifikasikan peminjam pada "pembayar yang baik" dan "pembayar yang buruk". Anda memiliki matriks karakteristik input (jenis kelamin, usia, pendapatan, dll) dan vektor hasil ("default", "not defaulted", dll). Ketika Anda memodelkan ini menggunakan jaringan saraf, Anda mengira bahwa ada fungsi , dalam arti yang tepat dari fungsi matematika. Fungsi ini f dapat menjadi kompleks semena-mena, dan dapat berubah sesuai dengan evolusi bisnis, sehingga Anda tidak dapat menurunkannya dengan tangan.CRf(C)=R

Kemudian Anda menggunakan Jaringan Saraf Tiruan untuk membangun perkiraan yang memiliki tingkat kesalahan yang dapat diterima untuk aplikasi Anda. Ini berfungsi, dan ketelitiannya bisa sangat kecil - Anda dapat memperluas jaringan, menyempurnakan parameter pelatihannya dan mendapatkan lebih banyak data hingga ketepatan mencapai sasaran Anda.f

Masalah kotak hitam adalah: Perkiraan yang diberikan oleh jaringan saraf tidak akan memberi Anda wawasan tentang bentuk f. Tidak ada tautan sederhana antara bobot dan fungsi yang diperkirakan. Bahkan analisis karakteristik input mana yang tidak relevan adalah masalah terbuka (lihat tautan ini ).

Plus, dari sudut pandang statistik tradisional, jaringan saraf adalah model yang tidak dapat diidentifikasi: Diberi data dan topologi jaringan, mungkin ada dua jaringan saraf dengan bobot berbeda dan hasil yang sama. Ini membuat analisis sangat sulit.

Sebagai contoh "model kotak non-hitam", atau "model yang dapat ditafsirkan", Anda memiliki persamaan regresi dan pohon keputusan. Yang pertama memberi Anda perkiraan bentuk tertutup dari f di mana pentingnya setiap elemen eksplisit, yang kedua adalah deskripsi grafis dari beberapa risiko relatif \ odds rasio.

Lucas Gallindo
sumber
Karena ini adalah jawaban lama, mungkin berguna bagi sebagian orang untuk menyediakan beberapa alat yang baru dikembangkan: "Perkiraan yang diberikan oleh jaringan saraf tidak akan memberi Anda wawasan tentang bentuk f" - Saya akan mengatakan bahwa SHAP sekarang melakukan pekerjaan yang bagus untuk penjelasan model, bahkan untuk jaring saraf. "Bahkan analisis yang karakteristik inputnya tidak relevan adalah masalah terbuka" - mothods seperti permutasi penting, serta SHAP, sekarang menangani masalah ini dengan cukup baik.
Bobson Dugnutt
3

Google telah menerbitkan Inception-v3 . Ini adalah Neural Network (NN) untuk algoritma klasifikasi gambar (memberi tahu kucing dari anjing).

Di koran mereka berbicara tentang keadaan klasifikasi gambar saat ini

Misalnya, GoogleNet hanya menggunakan 5 juta parameter, yang mewakili pengurangan 12x terhadap pendahulunya AlexNet, yang menggunakan 60 juta parameter. Selanjutnya, VGGNet menggunakan sekitar 3x lebih banyak parameter daripada AlexNet

dan itulah sebabnya kami memanggil NN untuk kotak hitam. Jika saya melatih model klasifikasi gambar - dengan 10 juta parameter - dan berikan kepada Anda. Apa yang bisa kamu lakukan dengan itu?

Anda tentu dapat menjalankannya dan mengklasifikasikan gambar. Ini akan bekerja dengan baik! Tetapi Anda tidak dapat menjawab pertanyaan berikut dengan mempelajari semua bobot, bias, dan struktur jaringan.

  • Bisakah jaringan ini memberi tahu Husky dari Pudel?
  • Objek mana yang mudah diklasifikasi untuk algoritma, mana yang sulit?
  • Bagian mana dari anjing yang paling penting untuk bisa mengklasifikasikannya dengan benar? Ekor atau kaki?
  • Jika saya memotret kucing yang menabrak anjing, apa yang terjadi, dan mengapa?

Anda mungkin dapat menjawab pertanyaan dengan hanya menjalankan NN dan melihat hasilnya (kotak hitam), tetapi Anda tidak memiliki perubahan pemahaman mengapa berperilaku seperti itu dalam kasus tepi.

bottiger
sumber
Saya pikir setidaknya satu dari pertanyaan ('Bagian mana dari anjing yang paling penting untuk dapat mengklasifikasikannya dengan benar? Ekor atau kakinya?') Cukup bisa dijawab, jika Anda melihat artikel dan video Matt Zeiler di dekonvolutitonal jaringan
Alex