Saya ingin dapat merancang classifier yang dapat membedakan berbagai jenis percakapan (tidak perlu menceritakan apa pun tentang suasana hati, ketulusan, atau hasil, yang agak terlalu jauh diambil).
Untuk mengetahui, misalnya, bahwa di antara 50 sampel percakapan, 10 melibatkan kedua belah pihak untuk mencari informasi tentang acara di masa depan, 30 tampaknya tidak memiliki tujuan, dan 10 melibatkan satu pihak untuk mencari informasi dari pihak lain tentang peristiwa masa lalu (sungguh-sungguh algoritma akan mengklasifikasikan ini sebagai tipe I, II, atau III tanpa memperhatikan keadaan sebenarnya).
Dengan kata lain, urutan pembicara akan penting bersama dengan konten, mungkin membantu seiring dengan menyemai algoritma dengan kata kunci tertentu.
Apakah ada sistem klasifikasi yang dapat melakukan tugas ini dengan tingkat presisi yang cukup tinggi?
Jawaban:
Ini adalah bagaimana saya akan mendekatinya. Anda benar-benar perlu memeriksa apakah teks di kelas I atau III (kalau tidak itu akan menjadi kelas II).
Jika Anda memiliki dataset pembelajaran yang cukup besar, Anda dapat dengan mudah mengetahui apa dua kantong kata, serta dua ambang batas untuknya.
sumber