2013-04-17 4 views
0

나는이 NLP에 새로 왔지만 POS 태깅 및 문장 청킹의 모든 예는 멈춤 단어를 제거하지 않은 것으로 보입니다. POS 태그 지정을 수행하고 Chunking을 수행하는 경우 질문을 통해 불용어 (및 줄기)를 제거해야 할 필요성이 제거됩니까?POS 태깅으로 중지 단어를 제거해야합니까?

답변

2

중단하려는 단어를 더 이상 설명하지 않으면 중지 단어를 제거 할 이유가 없습니다. POS 태그가 필요한 대부분의 응용 프로그램에서는 중지 단어를 포함하여 모든 입력 텍스트에 대해 POS 태그가 필요합니다.

+0

사과 주제 기반 분류를 수행하는 텍스트 분석 엔진을 계승했습니다. 내가 멈출 단어 나 POS tagger를 사용하지 않는다고 말할 수있는 것에서부터) 다양한 NLP 구성 요소 (토큰 화, 스템머, Lemmatisation, Taggers, Chunkers 등)가 함께 작동하는 방법에 대해 머리를 쓰려고합니다. 또는하지 않음) b) 카테고리 매칭을 개선하기 위해 이러한 개념 중 일부를 사용해야하는지 여부를 이해해야합니다. 답변 해 주셔서 감사합니다. 내 생각을 지금까지 확인해줍니다. – user2064232

+0

사과 할 내용이 없습니다. 이 답변으로 문제를 해결하는 데 도움이 되었다면 수락하는 것을 고려해보십시오 (대답의 큰 투표 수 아래의 체크 표시를 클릭하십시오. 나중에 마음이 바뀌면 취소 할 수 있음). – tripleee

+0

줄무늬 및 멈춤 단어는 텍스트를 일종의 간략한 표현으로 "끓여"기술하는 기술이며 검색 관련 작업에 자주 사용됩니다. POS 태깅은 더 많은 정보를 추가합니다. 문법 분석을 위해. 이러한 의미에서 이러한 기술은 서로 상반됩니다. – tripleee