edit-distance

    5

    3답변

    가장 가까운 일치 항목을 찾기 위해 컬렉션에 대해 문자열의 편집 거리를 계산하려고합니다. 현재의 문제는 컬렉션이 매우 커서 (약 25000 개 항목), 세트를 비슷한 길이의 문자열로 좁혀 야했지만, 여전히 수천 개의 문자열로만 좁혀졌으며 여전히 매우 느립니다. 유사한 문자열을 빠르게 검색 할 수있는 데이터 구조가 있습니까? 아니면이 문제를 해결할 수있는 다

    5

    2답변

    맞춤법 검사 모듈을 쓰려고합니다. 16 메가 바이트 파일에서 사전을 작성한 다음 발견 된 단어가 사전에있는 단어와 유사한 지 여부를 확인합니다 (비슷 함 = 최대 2 자까지). 그러면 사전에서 양식으로 변경됩니다. 지금 내가 설정 50 개 단어의 Levenshtein 거리 알고리즘과 처리를 사용하고 내가 빠른 해결책이 있어야한다는 확신 3 분 ... 걸립니

    11

    1답변

    2 개의 문자열 사이의 비교를 기반으로 유사성 점수를 지정하려고합니다. R에 동일한 기능이 있습니까? SAS에서 SPEDIS라는 이름의 기능을 알고 있습니다. R에 해당 기능이 있는지 알려주세요

    7

    2답변

    두 문자열 s 및 t이 주어졌습니다. s에있는 각 부분 문자열을 찾을 필요가 있습니다. t까지 거리 (Levenshtein distance). 사실 각각 i의 위치는 s에 있어야합니다. 위치는 i에서 시작된 모든 부분 문자열의 최소 편집 거리입니다. 예를 들어 : t = "ab" s = "sdabcb" 그리고 내가 좋아하는 뭔가를 얻을 필요가 : {

    0

    1답변

    Levenshtein Distance를 계산하려고했습니다. 다음 코드는 작은 문자열에 대해 작동합니다. 키트/피트 또는 앉아/니트. 그러나 일요일/토요일 문자열에 대한 세그먼트 오류가 발생했습니다. GDB를 사용한 후 (처음으로), 문제는 str2가 할당 된 메모리 공간을 초과하는 것으로 생각했습니다. 그러나 나는 방법을 알아낼 수 없었다. 나는 이것에 많

    2

    2답변

    편집 거리가 다른 하나 개의 문자열에 필요한 삽입, 삭제 또는 대체의 수를 찾습니다. 이 알고리즘에 스왑도 포함하고 싶습니다. 예를 들어 "사과"와 "아펠"여기 알고리즘을 참조 1.

    1

    2답변

    내 질문은 (는) Algorithm to transform one word to another through valid words 과 비슷하지만 큰 차이가 있습니다. 나는 하나의 고정 된 단어 "제임스"와 다양한 사전을 i/p라고합니다. 물론 사전을 사전 처리 할 수는 없습니다. 그래서 "JAMES"를 "JOHNY"로 처리하기위한 최소 비용을 다른 사전을

    10

    3답변

    문제점 : 두 문자열 사이의 LCS 길이가 필요합니다. 문자열의 크기는 최대 100 자입니다. 알파벳은 일반적인 DNA 하나, 4 자 "ACGT"입니다. 동적 접근 방식으로는 충분하지 않습니다. 제 문제는 내가 볼 수있는 한 수백만의 등급의 많은 쌍을 다루고 있다는 것입니다. 필자는 LCS_length 함수의 호출을 가능한 최소로 줄 였기 때문에 프로그램을

    1

    1답변

    실제로 편집 거리를 계산할 필요가 없습니다. 그냥 1인지 확인하십시오. 메소드의 서명은 다음과 같이 보일 수 있습니다 : 예를 들어 bool Is1EditDistance(string s1, string s2). : 1. "ABC"와 "AB"반환 사실 2. "abc 방송"과 "aebc"true를 반환 3 "abc"및 "a"는 false를 반환합니다. 재귀

    0

    1답변

    이것은 이론적 인 질문이므로 의사 코드를 사용하려고합니다. 다른 목록으로 변환해야하는 개체 목록이 있습니다. Levenshtein 알고리즘을 구현했는데 제대로 작동하지만 개체를 ​​유지하고 새로운 개체를 만들어야합니다. 짐작할 수 있지만 이드는 오히려 O (n * m)이 아닌 방법을 찾는다. [OBJ1, obj2보다, OBJ3] -> [OBJ1, OBJ4,