2016-06-01 2 views
1

Java Maven 프로젝트에서 ruta 스크립트를 동적으로 실행하고 있습니다. 스크립트는 HTML 파일에 주석을 달고 결과는 더 처리됩니다. 이제 coveredText는 아래와 같이 HTML 태그를 포함합니다.ruta 출력 또는 JCas에서 MARKUP을 무시하는 방법?

(a + b) < SUP> 2 </SUP는> ==> 화학식

으로 표시된하지만

로 할 (a + b) (2) ==>를 첨자로는 어디 다른 주석으로 캡처되어 나중에 처리됩니다.

예상되는 해결책에 도달하는 방법은 무엇입니까?

+0

, 문서 텍스트는 정적이다. 텍스트를 변경하려면 새로운보기/CAS를 만들어야합니다. ruta에는 수정 된 문서 텍스트가있는 cas를 만들 수있는 세 가지 구성 요소가 있습니다. HtmlConverter, RutaModifier, RutaCutter. 추가로 처리하려면 소파 매핑이 포함 된 집계 AE가 필요합니다. –

+0

어떻게해야합니까? PLZ는 코딩이나 링크를 도와줍니다. 감사 ! –

답변

1

UIMA에서 문서 텍스트는 정적입니다. 텍스트를 변경하려면 새로운보기/CAS를 만들어야합니다. ruta에는 수정 된 문서 텍스트가있는 cas를 만들 수있는 세 가지 구성 요소가 있습니다. HtmlConverter, RutaModifier, RutaCutter. 동일한 파이프 라인에서 추가로 처리하려면 소파 매핑 (또는 소파 인식 분석 엔진)이 포함 된 집계 AE가 필요합니다.

analysis enginesusage에 대한 문서가 있습니다. 이 규칙들 중 example project과 몇 가지 가능한 문제점을 설명하는 StackOverflow question도 있습니다. 소파 매핑에 대한 정보가 UIMA documentation

에서 찾을 수 있습니다 (면책 조항 : 나는 UIMA 루타의 개발자입니다) UIMA에서