function/structure words and content/lexical words은 어떻게 구별합니까?기능 대 콘텐츠 단어
나는 이미 StanfordCoreNLP을 사용하고 있으므로 가능하면 활용하고 싶습니다.
더 구체적으로 말하자면, annotator을 사용해야하며 콘텐츠/어휘를 어떻게 표시합니까?
나는 pos
을 시도했지만 기능과 내용어를 구별하지 않았습니다.
추신. 나는 lemma
어노 테이터를 사용하여 무시하고 싶은 단어를 얻습니다.
PPS. 나는 pyconlp
을 사용한다.
GitHub의 Stanford CoreNLP 버전을 사용하는 경우 해당 단어와 함께 정지 단어 목록을 배포합니다. 다음 경로에 있습니다. https://github.com/stanfordnlp/CoreNLP/blob/master/data/edu/stanford/nlp/patterns/surface/stopwords.txt – StanfordNLPHelp
이 링크는 Java에서 API를 사용하는 예를 보여줍니다. http : //stanfordnlp.github.io/CoreNLP/api.html – StanfordNLPHelp
할 수있는 한 가지는 토큰을 반복하고 정지 단어 목록에 있는지 확인하는 것입니다. – StanfordNLPHelp