다양한 텍스트 기반 필드에서 검색해야하는 응용 프로그램이 있습니다. 응용 프로그램은 NHibernate를 ORM으로 사용하여 개발됩니다. 키워드가 유사한 단어와 일치하는 경우에도 관련 결과를 반환 할 수 있도록 Porter Stemming을 검색에 구현하고 싶습니다. 예를 들어 제품 설명에 memories이 포함되어 있고 검색 키워드는 memory입니다.
Porter2 스 트리머 (또는 자바로 작성된 더 나은 스 트리머)의 모든 Java 구현을 알고 있습니까? 여기 포터 (안 Porter2)의 자바 버전이 있다는 것을 알고 http://tartarus.org/~martin/PorterStemmer/java.txt 하지만 http://tartarus.org/~martin/PorterStemmer/에서 저자는
나는이 게시물에 두 가지를 알아 내려고 노력 해요 : 하지 '내장'왜 가 필드 유형 정의가 정의 된 형태소 분석기에도 불구하고 '빌드'로 막아야된다. 그러나, '건물' 가 '빌드'를 비롯되고있다 무엇에 형태소있어 어떤 단어를 볼 수있는 인덱스를 검사 루크를 사용하는 방법. 루크에서 '건축'이 줄기 '빌드' 인 것을 볼 수 없었습니다. 나는 이 (가) '빌드
는 여기에서 촬영 한 자바 스크립트 알고리즘을 형태소 운반되는 : http://tartarus.org/~martin/PorterStemmer/js.txt 단순히 호출하여 알고리즘을 사용할 수 있도록하고 싶습니다 : var stemmed_word = porter_stemming_alg("some_word_to_stem");
누구든지 아래 코드에이 기능을
내 응용 프로그램에서 줄기 단어를 얻으려면 포터 줄기 알고리즘을 사용해야하지만 내가 http://www.tartarus.org/~martin/PorterStemmer에서 얻은 알고리즘을 테스트 할 때 형태소 분석의 결과가 올바른 줄기 단어를주지 않습니다. 예 : 행복 -> happi 바이러스 -> viru 등 해결할 수 있습니까?
에 포터 형태소 분석기 주어진 통합 내가 본 다음은, 그러나 C http://tartarus.org/martin/PorterStemmer/ 에 대한 포터 형태소 분석기의 구현이, 내 코드에서 통합 할 수 있습니다. 어떤 사람이 다운로드 한 파일을 어떻게 호출해야하는지, 그리고 문자열을 줄이기 위해 내가 전달해야 할 내용을 말해 줄 수 있습니까? 다른 말로하