Sepertinya saya bahwa ahli pembelajaran mesin / penambangan data akrab dengan P dan NP, tetapi jarang berbicara tentang beberapa kelas kompleksitas yang lebih halus (misalnya NC, BPP, atau IP) dan implikasinya untuk menganalisis data secara efektif. Apakah ada survei pekerjaan yang melakukan ini?
cc.complexity-theory
reference-request
machine-learning
Mike Izbicki
sumber
sumber
Jawaban:
Ada beberapa perbedaan yang melekat atau ketidaksamaan pendekatan antara dua bidang pembelajaran mesin yang diterapkan dan teori kompleksitas / TCS.
Berikut ini adalah lokakarya terbaru tentang masalah ini di Center for Computational Intractability, Princeton dengan banyak video.
Dalam TCS bidang studi utama "belajar" kadang-kadang mungkin membingungkan bahkan disebut "pembelajaran mesin" disebut teori PAC yang merupakan kependekan dari Mungkin Sekitar Kurang Tepat. asalnya awal 1980-an mendahului penelitian yang jauh lebih modern dalam "pembelajaran mesin." wikipedia menyebutnya bagian dari teori pembelajaran komputasi lapangan . PAC sering menyangkut hasil belajar rumus boolean yang diberikan sampel statistik dari distribusi, dll, dan keakuratan pembelajaran yang dapat diperoleh dengan berbagai algoritme atau sampel terbatas. Ini dipelajari dengan cara teoritis yang ketat dengan kaitan dengan kelas kompleksitas. Tapi itu bukan halaman studi & wikipedias terapan tentang pembelajaran mesin bahkan tidak mencantumkannya.
Kompleksitas Komputasi tesis PhD Pembelajaran Mesin oleh Kearns
Pembelajaran mesin Xing slide on (PAC)
sumber