ICA에서 WKS로 분석 된 문서 콜렉션을 내보내려고하고 있지만 UIMA 유형에서 WKS의 엔티티 유형으로 매핑해야한다고 나와 있습니다. 그러나 어떻게 진행해야하는지에 대한 설명을 찾을 수 없었습니다. 할 일을 알고있는 사람이 있습니까? 감사합니다.watson knowledge studio를 콘텐츠 분석과 매핑하는 방법은 무엇입니까?
0
A
답변
0
나는 몇 주 전에이 질문을했을 때 이렇게했습니다. 당신은 왓슨 지식 Studio 프로젝트에 XMI 파일을 가져 오기 전에, 당신은 UIMA 유형과 왓슨 지식 스튜디오 개체 유형 간의 매핑을 정의해야합니다
엔티티 유형
매핑 UIMA 유형 : 나는 다음과 단계를했다.
당신은 당신이에 UIMA 유형을 매핑 할 개체 유형을 포함해야합니다 왓슨 지식 Studio 프로젝트에
유형의 시스템을 시작하기 전에.
는 WKS 엔티티 유형에 UIMA 유형을 매핑하려면 :
는 UIMA 자료형 체계 설명자 파일이 포함 된 폴더에
cas2di.tsv
라는 이름의 파일과 같은exported_typesystem.xml
또는TypeSystem.xml
을 만듭니다.텍스트 편집기로
cas2di.tsv
파일을 엽니 다. 파일의 각 행은 단일 맵핑을 지정합니다.UIMA_Type_Name[TAB]WKS_Entity_Type
다음 예는 생산 UIMA 유형 간의 매핑을 정의
당신은 기본 형식을 사용하여 매핑을 만들 수 있습니다 매핑의 형식은 매핑 할 주석 기의 주석에 따라 달라집니다
com.ibm.langware.Organization ORGANIZATION
com.ibm.langware.Person PERSON
com.ibm.langware.Location LOCATION
하십시오 WKS 형식 시스템에 정의 된 IBM 왓슨 탐색기 내용 분석 및 개체 유형에 명명 된 엔티티 인식 주석 자 또 다른 예는 IBM 왓슨 탐색기 내용 분석 Studio와 왓슨 지식 스튜디오 개체 유형에서 만든 사용자 정의 주석 자에 의해 생산 UIMA 유형 간의 매핑을 정의
com.ibm.Person PERSON
com.ibm.Date DATE
당신은 패턴에 사용되는면에 따라 매핑을 만들 수 있습니다 Watson Explorer 컨텐츠 분석에서 Matcher 주석 자 또는 사전 조회 주석 자. 텍스트 분석 규칙 파일 (* .pat)에서 패싯은 범주 속성으로 표시됩니다.
com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]WKS_ENTITY_TYPE
처럼 :
com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]ORGANIZATION
가 Official Documentation를 참조 매핑을 정의하려면 다음 구문을 사용합니다.
알지만 작동하지 않습니다. –
좋아요, 똑같이 작동하고 완벽하게 작동합니다 ... 문제를 확인해보고 시도해보고 편집 할 수 있습니까? –
파일을 가져올 수 없습니다. 형식 시스템이 정의되지 않았기 때문에 주석이있는 문서를 가져올 수 없습니다. 주석이 달린 문서를 가져 오기 전에 동일한 원본 프로젝트에서 유형 시스템을 가져와야합니다. 문서가 UIMA CAS XMI 형식인지 확인하십시오. ('UIMA CAS XMI 형식으로 문서 가져 오기'를 선택했습니다.) –