Levenshtein (편집) 거리의 정규화의 차이는?

경우 s 및 tL(s,t) 주어진다 두 문자열 사이의 Levenshtein 거리Levenshtein (편집) 거리의 정규화의 차이는?

다음 두 가지 방식의 정규화 결과 휴리스틱에 미치는 영향의 차이는 무엇인가?

(L(s,t)*2)/[length(s) + length(t)]

L(s,t)/max[length(s), length(t)]

L(s,t)/[length(s) + length(t)]

정확히 무엇에 대한 영향? – kraskevich

결과 메트릭에 미치는 영향 및 다른 해석 – user2205916

이전 주석에 대한 후속 조치에서 정규화 된 차이점과 관련하여 무엇을 할 생각입니까? 이 질문에 대한 대답은 전적으로 그 질문에 달려 있다고 생각합니다. – templatetypedef

두 변종의 효과는 거의 동일해야한다. 두 번째 용어는 영 (문자열은 동일)에서 하나 (완전히 다른)까지의 범위를 다루는 반면 첫 번째 변형의 상위 범위는 문자열의 길이에 따라 다릅니다. 길이가 거의 같으면 상한은 0.5이며 길이 차이가 클수록 커집니다.

2016-12-09 19:50:53 clemens

답변