levenshtein-distance

    2

    1답변

    나는 Postgres를 사용하여 퍼지 검색을 만들려고 노력하고 있으며 django-watson을 기본 검색 엔진으로 사용하여 작업을하고 있습니다. 검색 할 모델의 모든 필드 값을 포함하는 tsvector라는 search_tsv라는 필드가 있습니다. 필자는 텍스트 필드에서 원하는 것을 정확히 수행하는 Levenshtein 함수를 사용하고 싶었습니다. 그러나,

    2

    2답변

    Steve Hanov에 설명 된대로 트리 트리를 사용하여 Levenshtein 거리 알고리즘을 구현했습니다. 그러나 특수 문자를 처리하는 데 어려움이 있습니다. 예를 들어, Großmann과 Grossmann 사이의 거리를 계산할 경우 ß와 ss는 같아야하므로 거리가 0이어야합니다. 이러한 특별한 경우를 지원하는 가장 좋은 해결책 (있는 경우)은 무엇이 될

    2

    1답변

    내 질문은 두 문자열을 비교하는 가장 빠른 (품질도 중요하지만 조금 덜 중요) 방법은 무엇입니까? 두 문자열을 비교하는 가장 효율적인 방법을 찾고 있습니다. 비교할 문자열 중 일부는 5000자를 초과 할 수 있습니다. 저는 약 80 개의 문자열 목록을 약 200 개의 문자열 목록과 비교하고 있습니다. 내가 쓰레딩 할 때조차도 영원히 필요합니다. 나는 Apa

    0

    1답변

    그냥 최근에 나는 약 Levenshtein algorithm를 찾고 있었어요 및 시간을 검색 한 후 내가 좋아하는 자바 스크립트 파일을 찾을 수 없습니다 : var dictionary = [ 'coke', 'cokeman', 'cokeney' ] 이 작업을 수행하는 빠른 방법이 있나요를? 이런 파일을

    4

    1답변

    Levenshtein 알고리즘의 경우 this implementation for Delphi입니다. 최대 거리에 도달하자마자 멈추고 지금까지 발견 된 거리를 반환하는 버전이 필요합니다. 내 첫번째 생각은 후 현재의 결과를 확인하는 것입니다 매일 반복 : for i := 1 to n do for j := 1 to m do begin

    2

    3답변

    그래서 간단한 문장 배열이 있다고 가정 해보십시오. 사용자 입력을 기반으로 검색하고 가장 일치하는 항목을 반환하는 가장 좋은 방법은 무엇입니까? Levenshtein 기능은 유망한 것으로 보이지만 나는 그것을 사용하고 싶지 않습니다. 사용자 입력은 highest mountain처럼 간단 할 수 있습니다.이 경우 highest mountain이있는 배열에서

    2

    3답변

    OCR 후에 유사한 문자열을 찾기 위해 Levenshtein 거리를 사용하고 있습니다. 그러나 일부 문자열의 경우 시각적 모양이 분명히 다르지만 편집 거리는 동일합니다. 예를 들어 문자열 Co이 일치하는 항목을 반환합니다 CY (1) CZ (1) Ca (1) 을 고려, 그 Co는 OCR 엔진의 결과이며, Ca는 것보다 더 가능성이 일치하는 것입니다.

    3

    2답변

    트렌드 주제의 ~ 100 트윗을 보여주는 응용 프로그램이 있습니다. 문제는 그 중 많은 부분이 실제로 유사하다는 것입니다 (즉, 서로 다른 URL을 가진 동일한 트윗). 그 이유는 정말 비슷한 트윗을 무시하고 싶기 때문입니다. 나는 파이썬으로 이것을하는 효율적인 방법을 찾고있다. 나는이 문제를 해결하기 위해 http://code.google.com/p/py

    1

    2답변

    퍼지 일치를 결정하기 위해 비교를 사용하는 스크립트에서 작업 중이므로 Levenshtein 기능을 사용하고 있습니다. 불행히도 터미널 창에서 easy_install python-Levenshtein을 실행할 때 Python은 가져 오기를 실행할 때 여전히 Levenshtein을 인식하지 못합니다. 내가 터미널 창에서 볼 때, 나는 (여기서 잘못이야 난이 생

    4

    3답변

    설명해 드리겠습니다. 저는 회사에서 약간의 퍼지 매칭을해야합니다. 그래서 ATM은 levenshtein 거리 계산기를 사용하고 두 용어 사이의 유사성 백분율을 계산합니다. 용어가 80 % 이상인 경우 Fuzzymatch는 "TRUE"를 반환합니다. 제 문제는 제가 곧 인턴쉽을 마치고 떠나는 것입니다. 이 작업을 계속할 사람들은 매크로를 사용하여 Excel을