2016-12-15 5 views
0

일반 텍스트 문서를 처리하고 문서에있는 대학/대학 이름과 같은 엔티티를 식별합니다. 때로는 이러한 이름이 다른 형식으로 작성되었지만 단일 대학/대학 이름을 나타냅니다.
예 :
자와 할랄 네루 기술 대학교 하이데라바드
J.N.T.U 하이데라바드
JNTU 하이데라바드
JNTU-H
할랄 네루 기술 대학교 (JNTU) 하이데라바드NER : 추출한 엔티티를 단일 실제 개념과 관련시킵니다.

위의 모든 이름이 같은 대학 이름을 참조하십시오.

어떻게이 모든 이름을 단과 대학/대학 이름과 연관시킬 수 있습니까?
(어떤 웹 서비스 나 Google 검색과 같은 것을 찾고 있는데, 그 이름을 검색하면 동일한 대학 링크를 반환하기 때문입니다.)

답변

0

이 작업의 이름은 "Entity Linking"입니다. 일부 시스템에서는 대부분 위키피디아 (특히 엔터티에 대한 언급을 허용하는 리디렉션) (예 : Babelfy 또는 DBpedia Spotlight)를 활용하여이 작업에 전념합니다.

이러한 서비스는 멘션을 고유 식별자로 연결하기 위해 데이터를 사용합니다. 엔티티에 대한 멘션이 가능한 경우, 대부분의 경우 엔 효과적 일 것입니다 (모호한 경우). 그러나 대부분의 경우 어휘집이 충분하지 않으므로 알 수없는 항목이나 언급에 직면 할 수 있습니다. 이 경우 기존 프레임 워크를 사용하여 자체 시스템을 구축하고 엔티티와 해당 멘션의 관련 데이터베이스를 제공해야합니다. 약어는 전체 이름에서 자동 생성 될 수 있습니다.