2017-03-12 6 views
0

Watson Explorer Content Analytics Studio에서 한 문장이나 단락에 여러 단어가 포함 된 동일한 유형의 여러 주석을 생성하는 방법을 찾고 있습니다. 하나의 주석을 지나치지 않고 모든 "텍스트 컨테이너"를 선택할 수 있지만 여전히 하나의 주석을 생성합니다. 내가 시도 "불이 레벨의 모든 규칙"하지만 그 또한 원하는 결과 몇 가지 샘플 아래Content Analytics Studio를 사용하여 동일한 유형의 다중 uima 주석을 추출하는 방법

숙제는 "봉쥬르 프랑스 '

장 1, 2, 책의 4 할 것이다 제공하지 않습니다

재 방문의 제 2 항 및 제 책의 제 2 장 3 큰 역사

3 장 1의 내용은 다음 꼬마를 들어 시험

의 일부가 될 것입니다 숙제 케이 것은

enter image description here

첫 번째 라인에 대한 예상 결과 (스크린 샷 참조) 페이지 1, 2 및

는 내가 지금까지 가지고하면 다음과 도우미입니다 교과서의 5를 읽는 것입니다

  1. 장 1 책 "봉쥬르 프랑스 '
  2. 제 2 장 책"B : 값/기능 형 SinglePieceOfContent의 3 주석입니다 onjour 프랑스 "
  3. 제 4 장 책"봉쥬르 프랑스는 "

나는 사용자 정의 주석 자 구축을 피하기 위해 싶지만, 그게 내가 그 확인보고 싶은 길을 가야하는 것입니다 경우.

+0

구문 또는 집계는 어떤 규칙 유형을 사용합니까? 나는 당신이 무엇을하려고하는지 완전히 모르겠습니다. 그러나 WEX Studio에서 언급 할 수있는 세 가지 특수 효과를 만드는 규칙을 만드는 것이 가능해야합니다. –

+0

@LeonardSaers 우리는 구문 규칙을 사용하고 있으며 WEX 스튜디오 – mpjjonker

답변

1

두 가지 방법이 있는데, 둘 다 약간 거추장스럽고 특이한 데이터로는 작동하지 않을 수 있습니다.

첫 번째 방법은 하나의 선택 규칙으로 여러 개의 주석을 만들 수 있다는 것입니다. 그래서 이것을하기위한 무차별 한 방법은 이런 식으로 보이는 셀렉터를 갖는 것입니다 (상위 레벨, 중간 토큰을 무시함). 먼저 END_LINK하면 관심이 하나의 문장에서 할 예정 주석의 최대 수를 선택하고, 5 말 :

Selection: 
find chapter chapter? chapter? chapter? chapter? book 
rule create 5 annotations, each with limited span over just the N they refer to and add book covered text as a feature to each. 

두 번째 방법은 업데이트를 사용하는 것입니다. 각 챕터를 식별하고 "기본"으로 설정된 문자열 피처 북을 포함하는 주석을 작성하십시오. 책을 식별하는 다른 주석을 만듭니다. 다음과 같이 집계 규칙을 만듭니다.

실제로 규칙이 작성되지 않습니다. 업데이트입니다. 업데이트는 한 번에 여러 주석을 처리 할 수 ​​있습니다.

+0

에서 이것을 달성하는 방법에 대해 매우 궁금합니다.이 문제를 해결해 드리겠습니다.그 동안 맞춤 Java 애노 테이터를 작성하여이 문제를 해결했지만,이 접근법도 확인하고 싶습니다. – mpjjonker

+0

모든 장이 실제로 텍스트에 언급되어있을 때이 작업을 볼 수 있지만 장을 가져 오는 방법을 모르겠습니다. 2 및 3 문장에서 : "학습 장 1 ~ 4 ..." – mpjjonker