Memahami dan menerapkan analisis sentimen

9

Saya baru saja ditugaskan proyek melakukan analisis sentimen untuk beberapa koleksi dokumen. Oleh Googling, banyak penelitian terkait sentimen bermunculan.

Pertanyaan saya adalah:

  1. Apa metode / algoritma utama untuk analisis sentimen di bidang pembelajaran mesin dan analisis statistik?

  2. Apakah ada hasil yang mapan?

  3. Apakah ada perangkat lunak sumber terbuka yang dapat melakukan analisis sentimen?

pengguna3269
sumber

Jawaban:

4

Coba SentiStrength yang berkinerja baik dibandingkan dengan algoritma yang sama, dan makalah penelitian terkait. Diskusi alat dan metode lain dapat ditemukan di sini dan di sini .

Vladtn
sumber
4

Saya mendapat kesan bahwa banyak hal yang dilakukan di sini sangat heuristik. Bahkan, kebanyakan orang tampaknya menerapkan ini pada <120 karakter pernyataan twitter. Mungkin hasilnya (walaupun tidak dihitung dengan cara ini) tidak jauh lebih baik daripada menghitung kata "positif" dan "negatif" dengan informasi posisi litte ("A lebih baik dari B" = positif untuk A, negatif untuk B)

Ketika Anda kemudian melihat perusahaan membeli feed twitter lengkap (itu berapa mbit per detik?) Dan mengklaim untuk melakukan analisis sentimen tentang ini, ini serius membuat saya bertanya-tanya apakah ada validitas statistik di sini. Tidak heran misalnya Yahoo gagal memprediksi prediksi pemilihan untuk South Carolina: http://www.technologyreview.com/web/39487/

Orang-orang adalah cara untuk bangga dan tertarik hanya karena sama sekali dapat memproses jumlah data, mereka tampaknya benar-benar mengabaikan validasi kinerja mereka.

Maaf menjadi pesimis tentang keadaan seni ini.

Memiliki QUIT - Anony-Mousse
sumber