2016-10-07 3 views
0

나는 Google Natural Language API으로 놀았으며 특히 위치 인식을 사용하여 HN의 "Who Is Hiring" page에서 위치를 추출했습니다. 같은 텍스트를 전달하면Google NL의 위치 엔티티 관련 문제 인식

Blockai | 샌프란시스코 | ML "와"CV : - CV/ML 및 프런트 엔드 엔지니어 https://blockai.com " enter image description here

문제가

(https://news.ycombinator.com/item?id=12631335에서)

그런 다음 NL API는 다음과 같은 개체를 반환" "는 위치로 인식되지만 실제로는"기계 학습 "과"컴퓨터 비전 "을 각각 나타냅니다. 알고리즘은 CV/ML이 다른 위치 (샌프란시스코, CA)와 텍스트.

API 출력에서 ​​이러한 "가짜"위치를 어떻게 인식 할 수 있는지 궁금합니다. 어쩌면 "샐리언스"매개 변수를 사용하는 것이 도움이 될 것이라고 생각했지만 엄지 법칙이 적합할지 모르겠다. API가 때때로 샐리언스 값이 1보다 큰 경우에도이 값은 , FE "는 [0, 1.0]의 범위이다."

{ 
    "name":"San Francisco", 
    "type":"LOCATION", 
    "metadata":{ 
    "wikipedia_url":"http://en.wikipedia.org/wiki/San_Francisco" 
    }, 
    "salience":1.4515763148665428, 
    "mentions":[ ] 

}

어떤 도움이 높게 평가되고!

답변

1

때로는 기본 알고리즘이 엔티티의 명확성을 위해 매우 까다로운 경우가 있습니다. 문맥이 충분하지 않을 때. 샐리언 스는 유형에 관계없이 엔티티의 중심이 얼마나 중요한지를 보여주기 때문에 샐리언 스는이를 지원하지 않습니다. 이 특별한 경우 엔 엔티티가 실제로 위치인지 여부를 평가하기 위해 제공된 메타 데이터 (예 : wikipedia url)를 잠재적으로 사용할 수 있습니다.