Кто-нибудь знает самый простой способ извлечь только существительные из текста?
Я слышал о инструменте TreeTagger, и я попытался дать ему шанс, но не смог заставить его работать по какой-то причине.
Любые предложения?
Спасибо Phil
EDIT:
import org.annolab.tt4j.*;
TreeTaggerWrapper tt = new TreeTaggerWrapper();
try { tt.setModel("/Nouns/english.par");
tt.setHandler(new TokenHandler() {
void token(String token, String pos, String lemma) {
System.out.println(token+"\t"+pos+"\t"+lemma); } });
tt.process(words); // words = list of words
} finally { tt.destroy();
}
Это мой код, английский - это язык. Я получаю сообщение об ошибке: Тип new TokenHandler() {} должен реализовать унаследованный абстрактный метод TokenHandler.token. Я что-то делаю неправильно?