2016-09-06 18 views
2

스노우 스테 무 알고리즘을 이해하려고합니다. HW90도 예제와 비슷한 질문이 있지만 내 질문은 아닙니다.Snowball Stemming : Null Region 정의

R1은 모음 따르는 최초의 비 모음 후의 영역, 또는이 경우 단어의 끝에서 상기 널 영역 이다로서 definied 두 영역들 R1 및 R2를 사용하는 algorithmus 다음 그러한 비 모음은 없습니다.

R2는 R1의 모음을 따르는 최초의 비 모음 후의 영역, 또는 그러한 비 모음이없는 경우 단어의 끝에서 상기 널 영역이다.

http://snowball.tartarus.org/texts/r1r2.html

이해가 안 무엇 "이라는 단어의 끝에 널 (null) 지역"입니다. 아무도 저에게 그걸 보여줄 수 있습니까?

답변

2

null 영역은 빈 영역을 나타내며 문자는 없습니다. 그래서,

다음

, R1과 R2는 영어 단어의 수를 나타내,

b e a u t i f u l 
        |<------------->| R1 
          |<----->| R2 

문자 t 아름다운의 모음 다음 첫 번째 비 모음입니다 : 당신은 documentation page의 예제를 놓쳤다 R1 은 iful입니다. iful에서 f는 모음 뒤에 오는 첫 번째 비 모음이고, 따라서 R2는 ul입니다.

b e a u t y 
        |<->| R1 
        ->|<- R2 

아름다움에서 마지막 문자 y는 모음으로 분류됩니다. 다시 문자 t는 모음 다음에 나오는 첫 번째 비 모음이므로 R1은 단지 마지막 문자 y입니다. R1은 모음이 아니므로 R2는 단어의 끝에있는 영 (null) 영역입니다.

b e a u 
      ->|<- R1 
      ->|<- R2 
+0

감사합니다. – NewbieXXL