2017-05-20 13 views
0

방금 ​​openNLP를 설치하고 일부 형태소 분석을 테스트했습니다. 결과를 파헤치는 사람들은 저에게 의심스러워 보입니다.OpenNLP에서 형태소 분석을하는 것이 합리적입니까?

people => peopl 
excellent => excel 
beautiful => beauti 

OpenNLP의 원본 출력물인지 또는 내 설치에 올바른 결과가 나오지 않는지 확실하지 않습니다.

누군가 나를 확인할 수 있도록 도와 줄 수 있습니까? 정말로 고마워.

답변

3

예, 맞습니다. 부터 Wikipedia :

줄기는 단어의 형태 학적 루트와 동일 할 필요는 없습니다. 이 줄기가 그 자체로 유효한 루트가 아니더라도 관련 단어가 동일한 줄기에 매핑되는 것이 일반적으로 충분합니다.

림프 타이 머는 형태 론적 루트를 반환하는 도구입니다. 그것은 굴절 된 단어와 pos 태그를 얻고 보조 정리를 반환합니다. OpenNLP Manual에서 사용 방법을 확인할 수 있습니다.