Bagaimana cara menggunakan filter stopwords khusus di Java Weka API?

8

Saya menggunakan Java Weka API untuk membangun model klasifikasi. Saya dapat menggunakan filter stopwords bawaan. Namun, saya perlu menggunakan filter khusus untuk masalah saya. Saya tidak tahu cara menggunakan filter stopwords khusus di Java Weka API.

Radia Karim
sumber

Jawaban:

7

Anda dapat mencoba kode berikut.

import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.unsupervised.attribute.StringToWordVector;
import weka.core.Instances;

Instances data = DataSource.read(".../document.txt"); //Your document .
filter.setInputFormat(data);
StringToWordVector filter = new StringToWordVector();
filter.setStopwords(new File(".../stopwords.txt")); //stop words file.
Instances data = Filter.useFilter(data,filter);

Anda juga dapat membaca dokumen berikut untuk pemahaman yang lebih baik tentang API Weka untuk Java. http://weka.sourceforge.net/doc.stable/

Howa Begum
sumber
Saya menghargai dukungan Anda. Terima kasih banyak. Kode Anda dan tautan dokumen sangat membantu saya.
Radia Karim
7

Pertama-tama Anda harus menyiapkan file teks untuk stopwords khusus Anda. Kemudian Anda dapat menggunakan kode berikut:

import weka.filters.unsupervised.attribute.StringToWordVector;

StringToWordVector filter = new StringToWordVector(10000);
filter.setStopwords(new File(".../stopwords.txt"));

Semoga ini bisa membantu Anda.

Rejaul Karim
sumber
Saya menghargai dukungan Anda.
Radia Karim
Saya sangat baru dalam pemrograman Java weka-api. Saya tidak mengerti dengan jelas. Siapa pun tolong berikan saya jawaban yang sedikit lebih rumit. Terima kasih sebelumnya atas dukungan Anda.
Radia Karim
Beri tahu kami bagian mana yang tidak Anda mengerti?
Rejaul Karim