경우 s
및 t
L(s,t)
주어진다 두 문자열 사이의 Levenshtein 거리Levenshtein (편집) 거리의 정규화의 차이는?
다음 두 가지 방식의 정규화 결과 휴리스틱에 미치는 영향의 차이는 무엇인가?
(L(s,t)*2)/[length(s) + length(t)]
L(s,t)/max[length(s), length(t)]
L(s,t)/[length(s) + length(t)]
- 나는 정규화 방법 2가 Levenshtein 거리 위키피디아 페이지가 권장 되나 언급이 접근 방식 1의 이루어지지 않습니다 것으로 나타났습니다. 두 가지 방법 모두 똑같이 유효합니까? 서로를 사용하는 것에 대해 수학적으로 정당성이 있는지 궁금합니다.
또한 접근 방식 1과 접근 방식 3의 차이점은 무엇입니까? 다음 예에
:
s = "Hi, my name is"
가t = "Hello, my name is"
L(s,t) = 4
length(s) = 14
(공백 포함)
(공백 포함) 상기 세 개의 표준화 알고리즘 주어진 691,363,210length(t) = 17
는Levenshtein 거리이다 :
4/(+ 17 14) = 0.129
4/(17) = 0.235
(4 * 2)/(14 + 17) = 0.258
정확히 무엇에 대한 영향? – kraskevich
결과 메트릭에 미치는 영향 및 다른 해석 – user2205916
이전 주석에 대한 후속 조치에서 정규화 된 차이점과 관련하여 무엇을 할 생각입니까? 이 질문에 대한 대답은 전적으로 그 질문에 달려 있다고 생각합니다. – templatetypedef