2016-11-01 6 views
0

내가 아래로 Markfast을 사용하고태그 Markfast

스크립트 :

WORDLIST PARTICLESLIST = 'NameswithParticles.txt'; 
DECLARE PARTICLES; 
Document{ -> MARKFAST(PARTICLES, PARTICLESLIST,true)}; 

NameswithParticles.txt :

der 
Der 
de 
De 
d' 
D' 
De la 
de La 
de la 
von 
Von 
van 
Van 
ten 
La 
la 
Le 
le 
L' 
St 
Al 
al 
O' 

샘플 입력 :

1.der Waals radius 
2.van Minh 
3.Der Brul 
4.de Brul 

der와 Der를 제외한 모든 입자 이름에 태그를 붙입니다.

+0

문제를 재현 할 수 없습니다. 4 개의 PARTICLES 주석을 얻습니다. 'MARKFAST'가 일치하지 않을 경우, txt 파일에 공백이 가장 많이 생깁니다. –

+0

@ PeterKluegl, 나는 위의 질문을 시도했다. 나는 또한 같은 문제에 직면했다 –

+0

UIMA Ruta의 어떤 버전을 사용합니까? (2.5.0을 사용했습니다.) –

답변

1

예. Whitespace 때문입니다. 그래서 구성 매개 변수에서 dictRemoveWS를 활성화하십시오. 자세한 내용은 의견보기 Wordlist -uima ruta

+0

스크립트 자체에 dictRemoveWS를 구성하는 방법 – prasanth

+0

이것은 공개되지 않은 문제입니다. 규칙으로 설정하는 방법은 없으며 구성 매개 변수에서만 가능합니다. –