나는 RUTA를 사용하고 있으며 동일한 엔티티를 추출하기 위해 여러 가지 규칙을 많이 작성했습니다. 예를 들어, "화장지 공장"을 추출합니다. 지금 내 규칙은 화장지 공장, 및 공장으로 귀착됩니다. 그러나 나는 가장 긴 시합에만 관심이 있습니다.UIMA Ruta 가장 긴 일치어에만 주석 달기
나는 최소한의 예를 만들었습니다
DECLARE Test;
(CW CW) {-> CREATE(Test)};
(CW CW CW) {-> CREATE(Test)};
그리고 내 테스트 문자열 :
lower lower Upper Upper Upper lower Upper
규칙은 위의 어퍼 어퍼 및 어퍼 어퍼 어퍼 일치합니다. 그러나이 경우 나는 마지막 규칙의 결과에만 관심이 있습니다.
더 짧은 성냥을 제거 할 수 있습니까?
이 :) 감사 UIMA 루타의 개발자입니다 - 최초의 솔루션에 필요한 특별한 루타 버전이 있습니까? 나는 2.3.1을 사용하고있다 두 번째 해결책은 효과가있다. – PascalTurbo
첫 번째 해결 방법은 UIMA Ruta 2.5.0이 필요합니다. 2.3.1에 대해서도이 규칙을 다시 작성할 수 있습니다 (예 : 블록 및 UNMARK의 유형 사용). –