Saya menggunakan Libsvm untuk melatih data dan memprediksi klasifikasi pada masalah analisis semantik . Tetapi memiliki masalah kinerja pada data skala besar, karena analisis semantik menyangkut masalah n-dimensi .
Tahun lalu, Liblinear dirilis, dan itu dapat menyelesaikan hambatan kinerja. Tetapi biaya memori terlalu banyak . Apakah MapReduce satu-satunya cara untuk menyelesaikan masalah analisis semantik pada data besar? Atau adakah metode lain yang dapat meningkatkan bottleneck memori pada Liblinear ?
machine-learning
bigdata
libsvm
Puffin GDI
sumber
sumber
Anda dapat memeriksa vowpal wabbit . Ini cukup populer untuk pembelajaran skala besar dan mencakup ketentuan paralel.
Dari situs web mereka:
sumber