현재 'lucene'과 'elasticsearch'를 사용하고 다음 문제가 있습니다. diminutive 단어에 대해 줄기 모양 또는 보조제가 필요합니다.줄 단어/형태소 분석
- 강아지 : - -> 개
- 고양이> 고양이
등
하지만 다음의 결과를 얻을 수
- 강아지 : 예를 들어 -> doggi
- 키티 -> 키티
어떤 방법이 있나요diminutive 단어 형태의 루트/원래 단어의 양식을 얻기 위해 (라이브러리, 어떤 알고리즘, 방법 등을 사용할 준비가 중요하지)?
번역 언어 : 러시아어. 예를 들어 :
- собачка -> собака
- кошечка - 사전에> кошка
감사합니다!
영어 형태소 분석에 어떤 종류의 체인을 사용하셨습니까? 나는 당신이'PorterStemFilter'를 사용하여 이것을 얻게되어 놀랄 것입니다. – mindas
형태소 분석이나 lemmatization을 사용하여 * kitty *에서 * cat *을 가져올 수 없으며 얻을 수도 없습니다. "cat"은 보조 정리도 아니며 "키티"의 줄기도 아닙니다. –