2017-11-12 18 views
0

Watson Knowledge Studio 기계 학습 주석 작성자를 교육하여 적절한 문장의 일부가 아닌 교육 정보를 식별하려면 어떻게해야합니까? 예를 들어 두 개의 글 머리 기호. 엔티티를 구분할 수있는 타입 시스템을 어떻게 구별 할 수 있습니까? 나는 관계 주석을 사용하는 것을 고려해 보았지만 공식 문서에 따르면 관계 유형은 구체적으로 관계를 언급 할 경우에만 주석을 달아야합니다. "IBM을위한 Mary works"와 같은 것은 employBy 관계 유형의 예입니다. (Mary는 EmployeeByyour) 그러나 자신의 비디오는 "Ford F-150"에 특정 B 관계가 명시되어 있어도 관계를 구체적으로 기술하지는 않았다. 예를 들어, "Ford F-150은 극을 타격했습니다." (F-150 manufacturedBy 포드)문장으로 구체적으로 식별되지 않는 세 부분의 관련 엔티티

이것은 내가 함께 일하고 있어요 텍스트의 종류 :

  • BA, 뉴욕 시립 대학, 1995
  • MA, 뉴욕 대학, 1997
  • "" "1999", BA를 "1997"
  • 박사, 컬럼비아 대학, 1999

나는 정도, 학교, 및 graduationYear 엔티티 이러한 주석을 달 수 있지만, 내가 다시 "1995"그만 둘거야 , "뉴욕 시립 대학", "컬럼비아 대학 University ","M.A. ","New York University ","Ph.D "; 내가 졸업 할 때 어떤 학교가 속한 학교인지 어느 정도 더 이상 말할 수 없기 때문에 일할 수없는 혼란.

답변

1

두 개의 글 머리 기호가 포함 된 식은 사전 기반 Tokenizer를 사용하여 문장을 WKS에서 사용할 수있는 정확성을 향상시킬 수 있습니다. https://console.bluemix.net/docs/services/knowledge-studio/create-project.html#wks_tokenizer

예제 텍스트를 WKS로 가져 와서 토큰 화 결과를 확인한 다음 표현식을 3 개의 문장으로 분리했습니다. 이 경우 학위, 학교 및 졸업 연도 간의 관계에 주석을 달 수 있습니다.

Example text