2016-12-20 2 views
1

UIMA ruta - 왜 작동하지 않습니까? 텍스트에 대한

level 110 KwH 

나는 규칙

W{REGEXP("level")} NUM{-> MARK(energy_consumption)} W{REGEXP("KwH")} 

를 가지고 있지만 작동하지 않습니다.

규칙

W{REGEXP("level")} NUM{-> MARK(energy_consumption)} W{REGEXP("KH")} 

작품과 텍스트 level 110 KH. 첫 번째 규칙이 작동하지 않는 이유는 무엇입니까?

답변

0

"KwH"가 W 주석이 아니라 W 주석 2 개 (실제로 CW)이므로 규칙이 일치하지 않습니다. KH은 하나의 W 주석 (실제로는 CAP)입니다. REGEXP 조건은 일치하는 주석 ("Kw")의 적용 대상 텍스트와 일치하므로 조건/정규식은 결코 충족되지 않습니다.

루타 시더 또는 일부 사전 조회 나 두 개의 CW 주석을 결합하는 일부 규칙에 토크 나이저를 추가로 사용하는 것이 좋습니다. Ruta가 제공 한 초기 주석은 시작점 일뿐 실제 토큰은 아닙니다.

면책 조항 : UIMA 루타의 I AMA 개발자