2011-02-15 3 views
1

프리 텍스트 검색 쿼리 (단일 입력 텍스트 상자)를 가능한 다양한 검색 유형으로 분류 할 수있는 로컬 검색 사이트에 대한 쿼리 구문 분석 알고리즘을 구축하려고합니다. 사이트.솔라로 자유 텍스트 (자연 언어) 쿼리 구문 분석

예 : 사용자는 xyz 근처에 중국 레스토랑을 입력 할 수 있습니다.

- there could be spelling mistakes 
- keywords may match in different columns e.g. a restaurant may have "chinese" in its name 

이것은 우리가 매우 제한된에서 검색하는 것을 시도하고 있기 때문에 자연 언어 구문 분석 문제가 정말 아니라고 주어진 "XYZ": "중국어", 지역을 : 나는 요리로 분해 대해 이동하는 방법 유용성

필자의 초기 생각은 특정 유형의 모든 값을 데이터베이스의 필드에 덤프하고 사용자 쿼리를 사용하여 모든 필드를 일치시키는 것입니다. 그런 다음 스코어 (그리고 미리 정의 된 신뢰 수준)를 기반으로 쿼리를 이름/요리/지역과 같은 3-4 개의 검색 필드로 나눕니다.

더 나은/표준 방법이 있습니다.

답변

-1

맞춤법 오류에 대해서는 사전/동의어 사전을 사용해야합니다. 이는 사전 처리 및 정규화의 일부일 수 있습니다.

여러 열을 쿼리하는 것에 대해 할 수 있습니다. 요리 : 중국어 OR 식당 이름 : 중국

다음 중 하나를 향상시킬 수 있습니다. cuisine : chinese^0.8 OR restaurant_name : chinese