저는 사전 처리를 시도하고 있습니다. 따라서 dont 등의 단어는 간단하게하지 않으려 고합니다. 나는 nltk가 편리한 것을 발견하지 못했음을 확인했다. 고유 명사의 사용에 대한 좋은 대답을 나는 조회의 원유 방법을 사용할 수 있지만, 문제는 일 등파이썬 : nlp : 영어 수축을 확장하지 마세요.
초기의 질문 Expanding English language contractions in Python
나던을 제안하십시오 존의 같은 고유 명사로 사용됩니다
존재하는 것과 고유 명사에 대해 다른 질문에서 제안 된 "원유"대체품을 사용하십시오. Jon의 차는 구문론 (Jon의 차)을 시도합니다. 너무 어렵지 않아야합니다. – gkusner