2011-10-22 3 views
2

에 포터 형태소 분석기 주어진 통합 내가 본 다음은, 그러나 C http://tartarus.org/martin/PorterStemmer/내가 여러 번 시도했지만 C

에 대한 포터 형태소 분석기의 구현이, 내 코드에서 통합 할 수 있습니다. 어떤 사람이 다운로드 한 파일을 어떻게 호출해야하는지, 그리고 문자열을 줄이기 위해 내가 전달해야 할 내용을 말해 줄 수 있습니까?

다른 말로하면, 나는 줄을 자르는 것을 요구하는 프로그램을 가지고 있고 그것을 위해 포터 줄기가 필요합니다. 위의 사용하는 생각하고 있지만 다운로드 된 파일을 사용하는 방법을 몰라. 당신이 전화를해야 하나

int stem (*str, int i, int j); 

예를

답변

2

을주십시오 C 코드는 기능을 제공합니다. 그것은 원래 문자열을 수정하고 result.The 일반적인 사용의 길이가 같은 것을 수행하는 기능 stem_file()에서 증명되고 반환 : 나는 2 층과 3 매개 변수가 무엇을 의미하는지 모르는

char buff[12345]; //should contain one word. 

buff [ stem(buff, xx, yy) ] = '\0' ; 

을 정확하게. 봐봐.

1

코드에는 두 부분이 있습니다.

Stemmer 정의 결말을 표시하는 부분이 있습니다. 이 전에는 포터의 알고리즘이 제시하는 주요 5 단계를 보여주었습니다. 파일 처리 부분을 다루는 부분은 문자를 소문자로 변환합니다. 줄기 기능은 초기화 부분을 다룹니다. j는 초기 단어 길이로 간주됩니다.

올바르게 통과하십시오. 이해하기 쉽지 않습니다.