많은 양의 텍스트 데이터를 가져 와서 분류하는 방법을 찾고있는 고객이 있습니다. 이 데이터는 분류되어야하며이를 수행하는 가장 쉬운 방법은 설명 필드를보고 거기에 보유 된 단어를 일치시켜 특정 레코드에 대해 카테고리를 도출 할 수 있는지 확인하는 것입니다.동의어 스타일 텍스트 조회 및 구문 분석
이 작업을 수행하는 가장 좋은 방법은 키워드를 각 카테고리에 대해 보유하고있는 핵심어와 일치시키는 것으로 생각했으며, 성공하지 못하면 동의어를 사용하여 대신이 단어를 사용할 수 있는지 확인하십시오. 예를 들어 특정 레코드에 "자동차"라는 단어가있는 경우 동의어 검색을 사용하면 해당 단어를 카테고리 "차량"에 대해 보유 할 "자동차"라는 단어와 일치시킬 수 있습니다.
누구든지 웹 서비스 또는 특정 단어에 대한 동의어를 찾기 위해 사전을 찾는 다른 방법을 알고 있습니까? 프로젝트 관리자는이를 위해 Google Enterprise Search 라이센스를 구입할 것을 제안했지만, 내가 할 수있는 것에서는이 사람들이 찾고있는 것을 제공하지 않습니다.
다른 고객이 원하는 것을 얻으려는 제안은 감사히 받아 들여질 것입니다.
고마워요! Wordnet을 살펴볼 것입니다.
다른 유형의 텍스트 분류 소프트웨어 제품에 대해 알고 계십니까? 거기에 대한 Bayasian 알고리즘을 사용하여 몇 가지 논의를 볼 수 있지만 그것을 실제 세계 예제를 볼 수 없습니다.