다음 란 단어와 함께 무엇을 해야할지하지 않습니다NLTK lemmatizer 미국인
from nltk import WordNetLemmatizer as wnl
wnl().lemmatize("American")
wnl().lemmatize("Americans")
둘 단순히 인수를 반환합니다. 나는 미국인들이 미국인으로 줄어들길 바란다. 아무도 어떻게 이런 일이 생길지 모를거야?
나는 lemmatizer가 사용하고있는 내부 사전을 수정해야한다고 생각했습니다. 이 올바른지? 더 나은 방법을 아는 사람이 있습니까?
감사합니다.
은 나에게 더 자연스러운 것 같다 :
모든 대문자 단어에 관심이 있다면
, 당신은 또한 케이스를 포함 할 수 있습니다. – RoundTower