2013-02-14 7 views
0

에 문자열을 근접 비교 당신은 두 개의 문자열 사이의 "근접성"을 비교하고 근접성의 백분율을 부여 할 수있는 라이브러리를 알고 있습니까?</p> <p>하나를 수행 ... 난 단지 ==의 차이에 대한 결과를 찾을 수와 동일, 자바에서 문자열 근접의 비교에 대해 이야기 모든 리소스를 찾을 수 없습니다 구글과 StackOverflow의 I에서 검색 한 후 자바

예 : 자동차 및이 매우 가까운 바,

아이디어는 예를 들어 쓴 도시를 비교할 수 있도록 매우 다르다 사용자가 중복 데이터를 피하기 위해 데이터베이스에있는 도시와 사용자가 "뉴욕"을 쓴다면 예를 들어, 당신은 루씬의 볼 수 있었다,

감사에게? 뉴욕을 ""당신은 의미합니까 "많은 :) 내가 SecondString MongeElkan 알고리즘을 사용했습니다

+0

구글 "NLP 단어 유사성"는 답변을 –

+0

감사합니다,하지만 NLP 단어 Wordnet는의 설명의 의미를 분석 동의어 또는 가까운 단어를 찾는되지 않습니다 :.? "WordNet® 영어의 큰 어휘 데이터베이스입니다. 명사, 동사, 형용사 및 부사는인지할만한 동의어 (synsets) 세트로 그룹화됩니다. " 실제로는 문자로만 인식하고 감각으로는 인식하지 않습니다. – c4k

+0

나는 Levenshtein 거리 알고리즘을 사용하여 이 주제는 제 생각에는 최선이 아니지만 제 필요에 부합합니다. StringUtils에서 사용할 수 있습니다. – c4k

답변