edit-distance

5열

3답변

가장 가까운 일치 항목을 찾기 위해 컬렉션에 대해 문자열의 편집 거리를 계산하려고합니다. 현재의 문제는 컬렉션이 매우 커서 (약 25000 개 항목), 세트를 비슷한 길이의 문자열로 좁혀 야했지만, 여전히 수천 개의 문자열로만 좁혀졌으며 여전히 매우 느립니다. 유사한 문자열을 빠르게 검색 할 수있는 데이터 구조가 있습니까? 아니면이 문제를 해결할 수있는 다

5열

2답변

비슷한 단어 찾기

맞춤법 검사 모듈을 쓰려고합니다. 16 메가 바이트 파일에서 사전을 작성한 다음 발견 된 단어가 사전에있는 단어와 유사한 지 여부를 확인합니다 (비슷 함 = 최대 2 자까지). 그러면 사전에서 양식으로 변경됩니다. 지금 내가 설정 50 개 단어의 Levenshtein 거리 알고리즘과 처리를 사용하고 내가 빠른 해결책이 있어야한다는 확신 3 분 ... 걸립니

11열

1답변

R (편집 거리)의 문자열 비교를 기반으로 한 유사성 점수

2 개의 문자열 사이의 비교를 기반으로 유사성 점수를 지정하려고합니다. R에 동일한 기능이 있습니까? SAS에서 SPEDIS라는 이름의 기능을 알고 있습니다. R에 해당 기능이 있는지 알려주세요

7열

2답변

모든 부분 문자열에 대한 편집 거리를 찾는 알고리즘

두 문자열 s 및 t이 주어졌습니다. s에있는 각 부분 문자열을 찾을 필요가 있습니다. t까지 거리 (Levenshtein distance). 사실 각각 i의 위치는 s에 있어야합니다. 위치는 i에서 시작된 모든 부분 문자열의 최소 편집 거리입니다. 예를 들어 : t = "ab" s = "sdabcb" 그리고 내가 좋아하는 뭔가를 얻을 필요가 : {

0열

1답변

Levenshtein Distance를 계산하면서 다차원 배열에서 세그멘테이션 오류 발생

Levenshtein Distance를 계산하려고했습니다. 다음 코드는 작은 문자열에 대해 작동합니다. 키트/피트 또는 앉아/니트. 그러나 일요일/토요일 문자열에 대한 세그먼트 오류가 발생했습니다. GDB를 사용한 후 (처음으로), 문제는 str2가 할당 된 메모리 공간을 초과하는 것으로 생각했습니다. 그러나 나는 방법을 알아낼 수 없었다. 나는 이것에 많

2열

2답변

편집 거리가

편집 거리가 다른 하나 개의 문자열에 필요한 삽입, 삭제 또는 대체의 수를 찾습니다. 이 알고리즘에 스왑도 포함하고 싶습니다. 예를 들어 "사과"와 "아펠"여기 알고리즘을 참조 1.

1열

2답변

다양한 사전으로 거리 편집

내 질문은 (는) Algorithm to transform one word to another through valid words 과 비슷하지만 큰 차이가 있습니다. 나는 하나의 고정 된 단어 "제임스"와 다양한 사전을 i/p라고합니다. 물론 사전을 사전 처리 할 수는 없습니다. 그래서 "JAMES"를 "JOHNY"로 처리하기위한 최소 비용을 다른 사전을

10열

3답변

LCS (Longest Common Subsequence)의 길이에 대한 빠른 알고리즘

문제점 : 두 문자열 사이의 LCS 길이가 필요합니다. 문자열의 크기는 최대 100 자입니다. 알파벳은 일반적인 DNA 하나, 4 자 "ACGT"입니다. 동적 접근 방식으로는 충분하지 않습니다. 제 문제는 내가 볼 수있는 한 수백만의 등급의 많은 쌍을 다루고 있다는 것입니다. 필자는 LCS_length 함수의 호출을 가능한 최소로 줄 였기 때문에 프로그램을

1열

1답변

Levenshtein 편집 거리가 1 문자열인지 확인하는 방법

실제로 편집 거리를 계산할 필요가 없습니다. 그냥 1인지 확인하십시오. 메소드의 서명은 다음과 같이 보일 수 있습니다 : 예를 들어 bool Is1EditDistance(string s1, string s2). : 1. "ABC"와 "AB"반환 사실 2. "abc 방송"과 "aebc"true를 반환 3 "abc"및 "a"는 false를 반환합니다. 재귀

0열

1답변

하나의 객체 목록을 다른 목록으로 변환

이것은 이론적 인 질문이므로 의사 코드를 사용하려고합니다. 다른 목록으로 변환해야하는 개체 목록이 있습니다. Levenshtein 알고리즘을 구현했는데 제대로 작동하지만 개체를 유지하고 새로운 개체를 만들어야합니다. 짐작할 수 있지만 이드는 오히려 O (n * m)이 아닌 방법을 찾는다. [OBJ1, obj2보다, OBJ3] -> [OBJ1, OBJ4,