Mengapa penggunaan teknik pembelajaran mesin yang jarang dalam biomedis translasi?

Ini sebagai tindak lanjut dari pertanyaan sebelumnya. di sini:

Model jaringan saraf untuk memprediksi hasil pengobatan

dan dapat dianggap merujuk pada aspek berbeda dari pertanyaan ini:

Penerapan teknik pembelajaran mesin dalam studi klinis sampel kecil

Terima kasih kepada Zach yang menyarankan reposting.

Saya sudah menaruh bacaan yang cukup serius sekarang di CART, randomForest, Neural Networks dan pembelajaran mesin secara umum, belajar tentang WEKA dan paket R, melihat dan mengikuti kuliah teknik Stanford http://www.ml-class.org/ kursus / kelas / indeks, Saya 3 bab ke Hastie. Mengingat jenis data yang kita lihat secara teratur dalam penelitian yang berorientasi klinis - banyak parameter klinis + banyak parameter biokimia + data pena dan kertas +/- data neuroimaging dengan angka yang lebih kecil, saya merasa bahwa saya kehilangan sesuatu. Saya tidak secara teratur membaca tentang teknik ML yang diterapkan dalam literatur penelitian. Pertanyaan saya adalah: apakah saya baru saja menempel pada sesuatu yang meragukan dan oleh karena itu dianggap dengan kecurigaan yang dibenarkan dengan meneliti dokter dan ahli biostatistik yang sangat menyadarinya, atau apakah teknik ini benar-benar diabaikan atau ditakuti di luar "analitik bisnis"? Apa yang membuatnya "niche"?

machine-learning medicine rosser
sumber

Saya pikir masalahnya di sini lebih terkait dengan jurnal apa yang Anda baca daripada yang lain. Pembelajaran mesin cukup banyak diterapkan dalam kedokteran translasi modern, asalkan model kotak hitam dapat diterima untuk tugas tersebut.

Marc Claesen

Jawaban:

Teknik pembelajaran mesin sering kekurangan interpretasi. Juga, mereka cenderung agak kasar dari sudut pandang statistik --- misalnya jaringan saraf tidak membuat asumsi tentang data input. Saya punya perasaan bahwa banyak orang (terutama jika mereka memiliki latar belakang statistik yang kuat) memandang rendah mereka.

bayerj
sumber

Ya, saya pikir saya mengerti. Namun, dari sudut pandang saya metode statistik tidak murni atau kotor, hanya penerapan logika data. Jika Anda ingin pil untuk menyembuhkan sesuatu, maka Anda perlu memahami hubungan timbal balik dan membawanya ke laboratorium biologi molekuler. Namun, Jika Anda hanya ingin membuat prediksi menggunakan metode black box (NN / RF) atau decision (CART), apa masalahnya? Anda bahkan mungkin mendapatkan wawasan. Apakah ini lebih dalam dari keangkuhan?

rosser

Sementara interpretabilitas tentu baik, saya tidak yakin apakah saya akan berkonsultasi dengan dokter yang tahu apa yang dia lakukan dan memiliki tingkat keberhasilan 60% dibandingkan dokter yang tidak memiliki petunjuk tetapi memiliki tingkat keberhasilan 100%;)

blubb

Anda mungkin tertarik pada 'Pemodelan Statistik -. Dua budaya' Leo Breiman, di mana hal ini dibahas secara mendalam ( recognition.su/wiki/images/8/85/Breiman01stat-ml.pdf ) Selain itu, ada alasan untuk pendekatan ini - - jika Anda ingin manusia menginterpretasikan hal-hal, misalnya.

bayerj

@blubb Saya akan berkonsultasi dengan dokter yang tidak memiliki petunjuk tetapi tingkat keberhasilan 100% dengan interval kepercayaan [98.100] :)

Simone

Rekam jejak pembelajaran mesin dalam biomedis belum terlalu baik. Keberhasilan awal dalam pembelajaran mesin datang dalam sinyal tinggi: bidang pengenalan pola rasio kebisingan seperti pengenalan pola visual. Rasio S: N jauh lebih rendah dalam biologi dan ilmu sosial. Pembelajaran mesin secara efektif cocok dengan banyak interaksi di antara para prediktor, dan untuk itu Anda harus memiliki ukuran sampel yang besar atau rasio S: N yang sangat tinggi. Lihat Apakah Obat Terpesona oleh Pembelajaran Mesin? . Selain itu, banyak praktisi pembelajaran mesin telah salah memahami tugas prediksi sebagai tugas klasifikasi. Lihat di sini untuk lebih lanjut.

Frank Harrell
sumber