저는 파이썬, NLTK 및 WordNetLemmatizer를 사용하여 사전 처리기에서 작업하고 있습니다. 'bad'
Python NLTK wordnet을 사용하여 'further'라는 단어를 사용합니다.
lem.lemmatize('worse', pos=wordnet.ADV) // here, we are specifying that 'worse' is an adverb
출력 : : 여기 'worse'
글쎄, 모든 것이 괜찮 는 여기에 내가
from nltk.stem import WordNetLemmatizer
from nltk.corpus import wordnet
lem = WordNetLemmatizer()
lem.lemmatize('worse', pos=wordnet.ADJ) // here, we are specifying that 'worse' is an adjective
출력을 기대하고 있었는지 출력하는 임의의 텍스트입니다. 이 동작은 'better'
(불규칙한 형태의 경우)이나 'older'
(같은 테스트의 경우 'old'
이 출력되지 않습니다. 그러나 wordnet은 기존의 모든 영어 단어의 철저한 목록이 아닙니다)
'furter'
으로 시도 할 때
내 질문은 온다 :
lem.lemmatize('further', pos=wordnet.ADJ) // as an adjective
출력 : 'further'
lem.lemmatize('further', pos=wordnet.ADV) // as an adverb
출력 : 'far'
이 단어는 'worse'
단어의 경우와 완전히 반대입니다.
아무도 나를 설명 할 수 있습니까? 그것은 wordnet synsets 데이터에서 오는 버그입니까, 아니면 영어 문법에 대한 오해에서 비롯된 것입니까?
질문에 이미 답변되어 있으면 google과 so를 검색했습니다. 그러나 "further"키워드를 지정하면이 단어의 인기로 인해 관련이 있지만 엉망이 될 수 있습니다.
가 사전에 감사합니다, 로맹 G.
좋은 캐치 , 그리고 추가 선 :'먼 멀리'. 결과는 다음과 같습니다.'lem.lemmatize ('further', pos = wordnet.ADJ)'>>'far'. 완벽하고 고맙습니다. 대단한 답변입니다! – alvas