2014-03-29 4 views
0

에서 국가, 도시와 장소를 추출. 예를 들어 "이미지 처리를위한 전산 지능에 관한 EEE 심포지엄"을 검색합니다. 나는 사용자 정의 검색 API 인 googles를 사용하고있다.내가 <strong>장소</strong> * <em>국가</em> *, 구글 검색 결과에서 <strong>도시</strong>에서 추출 할 필요가 구글 검색

내가 이런 조각, 내가 추출 응답 .... 마음에서 '툴레 인 대학, 뉴 올리언스'어떻게

"snippet": "The Computer Security Foundations Symposium is an annual conference for 
researchers in ... It was created in 1988 as a workshop of the IEEE Computer 
Society Technical Committee on Security and ... CSF-26 was held at Tulane 
University, New Orleans, LA, June 26-28, 2013. ... CSFW-19 program and 5- 
minute talks.", 

를 얻을 당신이 복수의 결과가 있지만 수 있습니다 내가 단지 1을 가정 이것을 포함하고있는 것.

답변

1

자연 언어를 다루는 것은 어렵다. 몇 가지 가능성이 있습니다. 그것은 정말로 입력에 달려 있습니다.

  1. 템플릿/정규식을 사용하여 찾을 수 있습니다. "개최 장소"또는 "조직 장소"등으로 장소가 소개되었다는 것을 알고 있다면 해당 정보를 사용하여 장소/위치를 추출 할 수 있습니다.

  2. POS/NE 태거를 사용하여 단어에 태그를 지정할 수 있습니다.

    CSF-26 NN O 했다 VBD O IN O에 VBN O 열린 툴레 인 NNP 조직 대학 NNP 조직 새로운 NNP 위치 : (에만 해당 문장과 정보를 이용하여, 단축)이 스탠포드 CoreNLP 파이프 라인의 수율을 사용하여 네브라스카 엔터티 태그 하였다 올리언스 NNP LOCATION LA NNP의 LOCATION 유월 NNP 날짜 26-28 CD의 CD DATE 2,013의 DATE

    단어가 POS 태그 이어진다. O는 "기타"를 나타내며 나머지는 설명이 필요합니다. 그런 다음 LOCATION 및 주변 LOCATION 또는 ORGANIZATION을 찾을 수 있습니다.

  3. 지리적 이름의 데이터베이스를 사용하여 COUNTRY/CITY를 찾은 다음 x 주변 단어를 볼 수 있습니다. 일반적으로 사용되는 "장소"이름 목록을 제공 할 수있는 경우이를 포함시켜 결과를 더욱 개선 할 수 있습니다. 이 단계는 다른 방법에도 통합 될 수 있습니다.


이 목록

철저한 없습니다. 그것은 입력의 분산에 크게 의존합니다.