Dalam kolokium baru-baru ini, abstrak pembicara mengklaim mereka menggunakan pembelajaran mesin. Selama pembicaraan, satu-satunya hal yang terkait dengan pembelajaran mesin adalah bahwa mereka melakukan regresi linier pada data mereka. Setelah menghitung koefisien paling cocok dalam ruang parameter 5D, mereka membandingkan koefisien ini dalam satu sistem dengan koefisien paling cocok dari sistem lain.
Kapan pembelajaran mesin regresi linier , bukan hanya menemukan garis yang paling cocok? (Apakah abstrak peneliti itu menyesatkan?)
Dengan semua mesin pembelajaran perhatian telah mengumpulkan baru-baru ini, tampaknya penting untuk membuat perbedaan seperti itu.
Pertanyaan saya adalah seperti ini , kecuali bahwa pertanyaan itu meminta definisi "regresi linier", sedangkan pertanyaan saya menanyakan kapan regresi linier (yang memiliki banyak aplikasi) dapat secara tepat disebut "pembelajaran mesin".
Klarifikasi
Saya tidak bertanya kapan regresi linier sama dengan pembelajaran mesin. Seperti yang telah ditunjukkan beberapa orang, algoritma tunggal tidak membentuk bidang studi. Saya bertanya kapan benar mengatakan bahwa seseorang melakukan pembelajaran mesin ketika algoritma yang digunakan hanyalah sebuah regresi linier.
Selain semua lelucon (lihat komentar), salah satu alasan saya bertanya ini adalah karena tidak etis untuk mengatakan bahwa seseorang melakukan pembelajaran mesin untuk menambahkan beberapa bintang emas ke nama Anda jika mereka tidak benar - benar melakukan pembelajaran mesin. (Banyak ilmuwan menghitung beberapa jenis garis yang paling cocok untuk pekerjaan mereka, tetapi ini tidak berarti bahwa mereka melakukan pembelajaran mesin.) Di sisi lain, jelas ada situasi ketika regresi linier yang digunakan sebagai bagian dari pembelajaran mesin. Saya mencari ahli untuk membantu saya mengklasifikasikan situasi ini. ;-)
Jawaban:
Menjawab pertanyaan Anda dengan pertanyaan: apa sebenarnya pembelajaran mesin? Trevor Hastie, Robert Tibshirani dan Jerome Friedman dalam Elemen Pembelajaran Statistik , Kevin P. Murphy dalam Pembelajaran Mesin Perspektif Probabilitas , Christopher Bishop dalam Pengenalan Pola dan Pembelajaran Mesin , Ian Goodfellow, Yoshua Bengio dan Aaron Courville dalam Pembelajaran Mendalam dan sejumlah "Alkitab" pembelajaran mesin lainnya menyebutkan regresi linier sebagai salah satu "algoritma" pembelajaran mesin. Pembelajaran mesin sebagian merupakan kata kunci untuk statistik terapan dan perbedaan antara statistik dan pembelajaran mesin sering kabur.
sumber
Regresi linier jelas merupakan suatu algoritma yang dapat digunakan dalam pembelajaran mesin. Tetapi, reductio ad absurdum : Siapa pun yang memiliki salinan Excel dapat menggunakan model linier.
Bahkan membatasi diri kita pada model linier, ada beberapa hal lagi yang perlu dipertimbangkan ketika membahas pembelajaran mesin:
Jawaban singkatnya, dari sudut pandang saya, adalah bahwa di mana pembelajaran mesin menyimpang dari pemodelan statistik tradisional adalah dalam penerapan brute force dan pendekatan numerik untuk pemilihan model, terutama dalam domain dengan sejumlah besar data dan sejumlah besar variabel penjelas , dengan fokus pada daya prediksi, diikuti oleh lebih banyak kekuatan kasar untuk validasi model.
sumber
Saya pikir definisi Mitchell memberikan cara yang bermanfaat untuk membumikan diskusi tentang pembelajaran mesin, semacam prinsip pertama. Seperti yang direproduksi di Wikipedia :
Ini membantu dalam beberapa cara. Pertama, untuk pertanyaan langsung Anda: Regresi adalah pembelajaran mesin ketika tugasnya adalah untuk memberikan nilai estimasi dari fitur prediktif dalam beberapa aplikasi. Kinerjanya harus meningkat, yang diukur dengan rata-rata kuadrat (atau absolut, dll.) Mengulurkan kesalahan, karena mengalami lebih banyak data.
Kedua, ini membantu menggambarkan pembelajaran mesin dari istilah terkait, dan penggunaannya sebagai kata kunci pemasaran. Bandingkan tugas di atas dengan standar, regresi inferensial, di mana analis menafsirkan koefisien untuk hubungan yang signifikan. Di sini program mengembalikan ringkasan: koefisien, nilai-p, dll. Program tidak dapat dikatakan untuk meningkatkan kinerja ini dengan pengalaman; tugasnya adalah perhitungan yang rumit.
Akhirnya, ini membantu menyatukan sub bidang pembelajaran mesin, baik yang biasa digunakan dalam eksposisi pengantar (diawasi, tidak diawasi) dengan yang lain seperti pembelajaran penguatan atau estimasi kepadatan. (Masing-masing memiliki tugas, ukuran kinerja, dan konsep pengalaman, jika Anda cukup memikirkannya.) Ini, menurut saya, memberikan definisi yang lebih kaya yang membantu menggambarkan dua bidang tanpa mengurangi keduanya secara tidak perlu. Sebagai contoh, "ML adalah untuk prediksi, statistik untuk inferensi" mengabaikan kedua teknik pembelajaran mesin di luar pembelajaran yang diawasi, dan teknik statistik yang berfokus pada prediksi.
sumber
Tidak ada hukum yang mengatakan bahwa pembuat kabinet tidak dapat menggunakan gergaji pembuat barel.
Pembelajaran mesin dan statistik adalah label yang tidak jelas, tetapi jika didefinisikan dengan baik ada banyak tumpang tindih antara statistik dan pembelajaran mesin. Dan ini berlaku untuk metode kedua bidang ini serta (dan secara terpisah) untuk orang - orang yang memberi label diri dengan kedua bidang ini. Tetapi sejauh matematika berjalan, pembelajaran mesin sepenuhnya dalam bidang statistik.
Regresi linier adalah prosedur matematika yang didefinisikan dengan sangat baik. Saya cenderung mengaitkannya dengan bidang statistik dan orang-orang yang menyebut diri mereka 'ahli statistik' dan mereka yang keluar dari program akademik dengan label seperti 'statistik'. SVM (Support Vector Machines) juga merupakan prosedur matematika yang didefinisikan dengan sangat baik yang memiliki beberapa input dan output yang sama dan memecahkan masalah yang sama. Namun saya cenderung mengaitkannya dengan bidang pembelajaran mesin dan orang-orang yang menyebut diri mereka ilmuwan komputer atau orang-orang yang bekerja dalam kecerdasan buatan atau pembelajaran mesin yang cenderung dianggap sebagai bagian dari ilmu komputer sebagai disiplin ilmu.
Tetapi beberapa ahli statistik mungkin menggunakan SVM dan beberapa orang AI menggunakan regresi logistik. Untuk lebih jelasnya, lebih mungkin bahwa ahli statistik atau peneliti AI akan mengembangkan metode daripada menggunakannya secara praktis.
Saya menempatkan semua metode pembelajaran mesin tepat di dalam domain statistik. Bahkan hal-hal baru seperti Deep Learning, RNNs, CNNs, LSTMs, CRFs. Seorang ahli statistik terapan (ahli biostatistik, ahli agronomi) mungkin tidak akrab dengan mereka. Itu semua adalah metode pemodelan prediktif yang biasanya diberi label 'pembelajaran mesin', dan jarang dikaitkan dengan statistik. Tetapi mereka adalah model prediksi, dengan kelonggaran bahwa mereka dapat dinilai menggunakan metode statistik.
Pada akhirnya, regresi logistik harus dianggap sebagai bagian dari pembelajaran mesin.
Tapi, ya, saya melihat dan sering berbagi ketidaksukaan Anda atas kesalahan penerapan kata-kata ini. Regresi linier adalah bagian fundamental dari hal-hal yang disebut statistik sehingga terasa sangat aneh dan menyesatkan untuk menyebut penggunaannya sebagai 'pembelajaran mesin' .
Sebagai ilustrasi, regresi logistik identik secara matematis dengan jaringan Deep Learning tanpa simpul tersembunyi dan fungsi logistik sebagai fungsi aktivasi untuk simpul keluaran tunggal. Saya tidak akan menyebut regresi logistik sebagai metode pembelajaran mesin, tetapi tentu saja ini digunakan dalam konteks pembelajaran mesin.
Ini sebagian besar masalah harapan.
Ini seperti mengatakan, ketika mencuci jendela dengan air Anda menggunakan kimia kuantum. Ya tentu saja itu tidak salah secara teknis tetapi Anda menyiratkan lebih banyak dari yang dibutuhkan.
Tapi sungguh, itulah perbedaan budaya vs perbedaan substansi. Konotasi kata dan asosiasi dengan kelompok orang (LR sama sekali bukan ML!) Vs matematika dan aplikasi (LR benar-benar ML!).
sumber
Pandangan umum adalah bahwa pembelajaran mesin terdiri dari 4 bidang:
1) Pengurangan Dimensi
2) Clustering
3) Klasifikasi
4) Regresi
Regresi linier adalah regresi. Setelah model dilatih, itu dapat digunakan untuk prediksi, seperti yang lainnya, katakanlah, Regresi Hutan Acak.
sumber
Regresi linier adalah teknik, sedangkan pembelajaran mesin adalah tujuan yang dapat dicapai melalui berbagai cara dan teknik.
Jadi kinerja regresi diukur dengan seberapa dekat itu sesuai dengan garis / kurva yang diharapkan, sementara pembelajaran mesin diukur dengan seberapa baik dapat memecahkan masalah tertentu, dengan segala cara yang diperlukan.
sumber
Saya akan berpendapat bahwa perbedaan antara pembelajaran mesin dan inferensi statistik jelas. Singkatnya, pembelajaran mesin = prediksi pengamatan masa depan ; statistik = penjelasan.
Berikut ini adalah contoh dari bidang minat saya (kedokteran): ketika mengembangkan suatu obat, kami mencari gen yang paling baik menjelaskan keadaan penyakit, dengan tujuan menargetkannya dengan obat. Kami menggunakan statistis untuk itu. Sebaliknya, ketika mengembangkan tes diagnostik, misalnya memprediksi apakah obat akan membantu pasien, tujuannya adalah menemukan prediktor terbaik untuk hasil di masa depan, bahkan jika itu terdiri dari banyak gen dan terlalu rumit untuk dipahami. Kami menggunakan pembelajaran mesin untuk tujuan ini. Ada beberapa contoh yang dipublikasikan [1], [2], [3], [4] yang menunjukkan bahwa keberadaan target obat bukanlah prediktor yang baik dari hasil pengobatan, oleh karena itu perbedaannya.
Berdasarkan hal ini, cukup adil untuk mengatakan bahwa seseorang melakukan pembelajaran mesin ketika tujuannya secara ketat memprediksi hasil pengamatan di masa depan / yang sebelumnya tidak terlihat. Jika tujuannya adalah memahami fenomena tertentu, maka itu adalah inferensi statistik, bukan pembelajaran mesin. Seperti yang telah ditunjukkan orang lain, ini benar terlepas dari metode yang digunakan.
Untuk menjawab pertanyaan Anda: dalam penelitian spesifik yang Anda gambarkan, para ilmuwan membandingkan peran faktor (bobot) dalam model regresi linier yang berbeda, bukan membandingkan akurasi model. Oleh karena itu, tidak akurat untuk memanggil pembelajaran mesin inferensi mereka.
[1] Messersmith WA, Ahnen DJ. Menargetkan EGFR pada Kanker Kolorektal. Jurnal Kedokteran New England; 2008; 359; 17.
[2] Pogue-Geile KL et al. Prediksi Tingkat Manfaat Dari Adjuvant Trastuzumab di NSABP Trial B-31. J Natl Cancer Inst; 2013; 105: 1782-1788.
[3] Persetujuan Pazdur R. FDA untuk Vemurafenib. https://www.cancer.gov/about-cancer/treatment/drugs/fda-vemurafenib . Diperbarui 3 Juli 2013.
[4] Ray T. Dua Studi ASCO Menunjukkan Tantangan Menggunakan Pensinyalan MET sebagai Penanda Prediktif dalam Uji Coba Obat NSCLC. GenomeWeb, 11 Juni 2014.
sumber
Ini bisa berguna untuk memanggil pembelajaran mesin regresi linier karena melakukan hal itu biasanya menyiratkan beberapa hal penting tentang bagaimana Anda menyelesaikan masalah Anda:
Namun, jika model Anda lebih dimaksudkan untuk menjelaskan daripada memprediksi, dan Anda benar-benar memeriksa asumsi kausal teoretis model Anda, dll. Maka ya, agak konyol menyebutnya sebagai pembelajaran mesin.
sumber
Memang, jawaban apa pun untuk pertanyaan ini lebih dari sekadar opini objektif, tetapi saya akan mencoba menjelaskan logika saya mengapa saya pikir jawabannya tidak pernah . Apa pun yang disebut ahli atau instruktur pembelajaran mesin hanya mengungkapkan ketidaktahuan mereka dengan mewakili regresi linier seperti itu.
Delineasi disiplin akademis lebih tentang delineasi komunitas daripada metode. Disiplin ilmiah meminjam metode lintas disiplin sepanjang waktu. Juga, pada abad ke-19 (ketika regresi linier dikembangkan) dan sebelum itu, disiplin ilmu tidak begitu jelas digambarkan seperti sekarang. Jadi khususnya ketika metode dikembangkan pada abad ke-19 atau sebelumnya, kita harus berhati-hati untuk menugaskan mereka ke disiplin ilmu tertentu.
Yang sedang berkata, orang dapat melihat sejarah disiplin dan masuk akal menyimpulkan bahwa metode tertentu "milik" satu disiplin atau yang lain. Tidak ada yang akan mengatakan hari ini bahwa kalkulus milik bidang fisika, meskipun Newton, yang merupakan salah satu penemu kalkulus, pasti mencoba menerapkan ini pada fisika. Kalkulus jelas milik disiplin matematika, bukan fisika. Ini karena kalkulus adalah metode matematika umum yang dapat digunakan sepenuhnya di luar konteks fisika.
Dengan alasan yang sama, regresi linier termasuk ke dalam disiplin statistik, meskipun itu umumnya digunakan sebagai contoh sederhana dari pengumpanan data ke model dalam konteks pembelajaran mesin. Sama seperti kalkulus dapat digunakan di luar konteks fisika, regresi linier dapat (dan sedang) digunakan di luar konteks pembelajaran mesin.
Instruktur pembelajaran mesin akan bijaksana untuk menunjukkan bahwa regresi linier telah digunakan sejak akhir abad ke-19 jauh sebelum gagasan modern tentang pembelajaran mesin muncul. Mereka juga harus menekankan bahwa pembelajaran mesin menggunakan banyak konsep dari probabilitas dan statistik, serta disiplin ilmu lain (misalnya teori informasi). Namun, konsep-konsep ini sendiri tidak mewakili pembelajaran mesin atau "algoritma" pembelajaran mesin.
sumber
Ini Mesinnya, Bodoh!
Saya bukan ahli statistik atau pakar Big Data (TM). Namun, saya akan mengatakan bahwa perbedaan penting adalah bahwa "pembelajaran mesin" membutuhkan "mesin". Secara khusus, ini menyiratkan agensi . Hasilnya tidak akan dikonsumsi dengan santai oleh manusia. Sebaliknya, hasilnya akan menjadi input untuk siklus tertutup di mana sistem otomatis meningkatkan kinerjanya.
Sistem Tertutup
Ini sangat sejalan dengan jawaban Sean Easter, tetapi saya hanya ingin menekankan bahwa dalam aplikasi komersial, sebuah mesin melihat hasil dan bertindak atas mereka . Contoh klasik adalah algoritma CineMatch yang menjadi target Hadiah Netflix. Manusia dapat melihat output dari CineMatch dan mempelajari fitur menarik tentang penonton film. Tapi itu bukan alasan mengapa itu ada. Tujuan CineMatch adalah untuk menyediakan mekanisme di mana server Netflix dapat menyarankan film kepada pelanggan yang akan mereka nikmati. Output dari model statistik masuk ke layanan yang merekomendasikan, yang pada akhirnya menghasilkan lebih banyak input sebagai film tingkat pelanggan, beberapa di antaranya dipilih berdasarkan saran dari CineMatch.
Sistem terbuka
Di sisi lain, jika seorang peneliti menggunakan algoritma untuk menghasilkan hasil statistik yang ditampilkan dalam presentasi kepada manusia lain, maka peneliti tersebut jelas-jelas tidak terlibat dalam pembelajaran mesin . Bagi saya ini adalah pembelajaran manusia . Analisis dilakukan oleh mesin, tetapi bukan mesin yang melakukan pembelajaran , per se. Sekarang, ini adalah "pembelajaran mesin" sampai-sampai otak manusia tidak mengalami semua input sampel dan memperoleh hasil statistik "secara biologis". Tapi saya akan menyebutnya "statistik" karena inilah yang dilakukan para ahli statistik sejak bidang ini ditemukan.
Kesimpulan
Jadi, saya akan menjawab pertanyaan ini dengan bertanya: "Siapa yang mengkonsumsi hasilnya?" Jika jawabannya adalah: "manusia", maka itu "statistik". Jika jawabannya adalah: "perangkat lunak", maka itu "pembelajaran mesin." Dan ketika kami mengatakan bahwa "perangkat lunak mengkonsumsi hasilnya", kami tidak bermaksud bahwa perangkat lunak itu menyimpannya di suatu tempat untuk pengambilan nanti. Kami berarti melakukan perilaku yang ditentukan oleh hasil dalam loop tertutup .
sumber
Menurut pendapat saya, orang dapat berbicara tentang pembelajaran mesin ketika mesin diprogram untuk menyimpulkan parameter beberapa model menggunakan beberapa data.
Jika regresi linier dilakukan oleh mesin, maka itu memenuhi syarat.
Jika dilakukan dengan tangan, maka tidak.
Definisi yang bergantung pada prevalensi beberapa agen (seperti Excel), atau peningkatan berulang (seperti yang disarankan Sean Easter di atas), entah bagaimana mencoba memisahkannya dari statistik atau tergantung pada apa yang harus dilakukan dengan hasil akan terbukti tidak konsisten, menurut pendapat saya.
sumber