Tabel 18.1 dalam Elemen Pembelajaran Statistik merangkum kinerja beberapa pengklasifikasi pada set data 14 kelas. Saya membandingkan algoritma baru dengan laso dan jaring elastis untuk masalah klasifikasi multikelas.
Menggunakan glmnet
versi 1.5.3 (R 2.13.0) saya tidak dapat mereproduksi titik 7. (yang multinomial -penalized) pada tabel, di mana jumlah gen yang digunakan dilaporkan menjadi 269 dan kesalahan uji adalah 13 keluar 54. Data yang digunakan adalah set data microarray 14-kanker ini . Apa pun yang saya coba, saya mendapatkan model dengan kinerja terbaik di lingkungan 170-180 gen dengan kesalahan uji 16 dari 54.
Perhatikan bahwa pada awal Bagian 18.3, di halaman 654, beberapa pemrosesan data diuraikan.
Saya telah menghubungi penulis - sejauh ini tanpa tanggapan - dan saya bertanya apakah ada yang bisa mengkonfirmasi bahwa ada masalah dalam mereproduksi tabel atau memberikan solusi tentang cara mereproduksi tabel.
Jawaban:
Sudahkah Anda memeriksa paket R buku ini? itu berisi semua kumpulan data, fungsi dan sebagian besar skrip yang digunakan di sana ...
sumber