2012-09-01 11 views

답변

2

Part-of-speech Tagger (우승자)이 필요합니다. 이것은 문장의 모든 단어의 역할을 식별합니다. Wikipedia는 NLP 툴킷이 excellent list이며 거의 모든 것이 Postaggers를 사용합니다.

귀하의 자료가 정상적인 서면 영어 인 경우, Postaggers는 잘 할 것입니다. 매우 구어체이거나 (예 : 문자 메시지) 매우 비정상적인 경우 (예 : 특수 용어) 악화 될 수 있습니다. 특수 언어 (화학을 할 때)는 단어 토큰이있는 곳을 알아 내기 위해 토크 나이저가 필요할 수도 있습니다.

"정서 분석"에 대해 언급했습니다. 이것은 훨씬 더 많은 일이지만 절대적으로 시스템에 POSTagger가 필요할 것입니다. 또한 의미 론적 분석을 언급합니다.이 때문에 의미 론적 어휘집이 필요할 수 있습니다. 그러나 Postagger로 시작하여 일반적인 문장으로 연습하십시오.

+0

ur 도움에 감사드립니다 ... 녹 그냥 아파치 OpenNLP에 대해 읽었습니다 ... 또한 pos 태깅 및 구문 분석을 수행하는 데 사용할 수 있습니다 ... 그래서 나는 그것을 사용할 수 있습니다 .. 또는 다른 좋은 비교할 수 있습니다. 사용할 수있는 ...... –