levenshtein-distance

0열

2답변

나는 levenshtein trie의 구현을 위해 웹을 검색했으며 이걸 발견했습니다 : Levenshtein Distance Challenge: Causes. 단어를 정규화하는 코드를 추가하려고했습니다. 예를 들어 단어 에 5 글자 ('Apple')가 있고이 단어 ('Aple')가있는 경우 거리가 1이고 동일한 것으로 간주합니다. 예를 들어 에 단어가 더

1열

1답변

Levenshtein 거리 알고리즘에서 삭제 횟수를 개별적으로 계산

Levenshtein Distance 알고리즘은 String A를 String B로 변경하는 데 필요한 삭제, 삽입 및 대체의 최소 수를 고려한다는 것을 알고 있습니다.하지만 궁금합니다 변경을 수행하는 데 필요한 전체 편집에서 삭제 횟수를 개별적으로 추적 할 수있는 방법. 나는 그래서 삭제를 추적하기 위해, 알고리즘의 구현을 def levenshtein(f

0열

1답변

비대칭 Levenshtein 거리

두 비트 열 x와 y가 y보다 길고 y가 주어지면이 두 비트 사이의 Levensthein 거리의 비대칭 변형을 계산하고 싶습니다. x로 시작하여 x를 y로 바꾸는 데 필요한 최소 삭제 및 대체 수를 알고 싶습니다. 일반적인 Levensthein 거리를 사용하거나 알고리즘을 어떻게 수정해야합니까? 즉, 삭제, 대체 및 추가 편집의 일반적인 세트를 사용하면 두

6열

1답변

숫자 벡터를 사용한 Levenshtein 유형 알고리즘

숫자 값이있는 두 개의 벡터가 있습니다. 이러한 v1 <- c(1, 3, 4, 5, 6, 7, 8) v2 <- c(54, 23, 12, 53, 7, 8) 으로 나는 삽입, 삭제 및 대체 내가 특정 조작 당 비용 (C1)C2과 함께 다른에 하나의 벡터를 설정해야의 수를 계산하고 싶습니다 c3입니다. 나는이 함수가 기본 패키지의 adobe이 문자열에 대해

1열

2답변

많은 단어의 Levenshtein 거리의 속도 최적화

많은 단어 (약 15000)가 포함 된 셀 배열 사전이 있습니다. 모든 단어 쌍에 대해 strdist (Levenshtein 거리를 계산하기 위해) 함수를 계산하고 싶습니다. 나는 두 가지 방법으로 시도했지만 둘 다 정말 느립니다. 보다 효율적인 솔루션은 무엇이 될 수 있습니까? 붙박이 MATLAB 1) matrix = sparse(m,m); for i

-2열

2답변

Python에서 Levenshtein의 문자열 목록 그룹화

두 문자열의 Levenshtein 거리를 계산하는 스크립트를 만들었습니다. 이제 Levenshtein 거리를 기준으로 문자열 목록을 그룹화하려고합니다. (문자열에 임계 값 이하의 거리가있는 경우 동일한 문제가 발생합니다.) 지금까지 뭔가를했지만 작동하지 않는 것 같습니다. 여기 for every string in list: create a new

0열

1답변

pandas DataFrames를 사용하여 Levenshtein 거리를 계산하십시오.

다음 팬더 DataFrame에 대해 Levenshtein distance을 계산하려고합니다. 나는 그것을 위해 this 패키지를 사용하고 있습니다. In [22]: df = pd.DataFrame({'id' : [1,2,3,4,5,6,7], 'path' : ["abc,cde,eg,ba","abc,cde,ba","abc,yz,zx,eg","ab

0열

1답변

Laravel migration 원시 SQL 오류

Laravel에서 검색을 위해 Levenshtein 거리를 사용하고 싶습니다. 나는 (app/database/migrations/levenshtain.sql로 저장) SQL 함수를 발견 DELIMITER // CREATE FUNCTION `LEVENSHTEIN`(s1 VARCHAR(255) CHARACTER SET utf8, s2 VAR

0열

1답변

Levenshtein 거리 알고리즘

def worddistance(source, target): ''' Return the Levenshtein distance between 2 strings ''' if len(source) > len(target): source, target = target, source #Now target becomes the

4열

2답변

여러 단어의 이름을 Levenshtein 거리와 비교하기

저는 캠퍼스의 건물 이름을 다양한 데이터베이스의 입력과 비교하고 있습니다. 사람들은이 이름을 입력하고 모두가 자신의 약어를 사용합니다. 나는 사용자 입력에서 가장 일치하는 이름을 정식 형식으로 찾으려고합니다. 저는 재귀적인 Levenshtein Distance 방법을 구현했습니다. 그러나 해결하려는 몇 가지 단점이 있습니다. My implementation