나는 100k 개의 문자열을 서로 비교하려고합니다. 문제 크기 (즉, 세트의 # 문자열)를 더 이상 줄일 수는 없습니다. 나는 비교하기 위해 Levenshtein 비율을 사용하고 있습니다. 비율이 0.9보다 크면 두 개의 문자열을 목록에 저장하려고합니다. 내 질문은 런타임 최적화에 관한 것입니다. 0.9가 나의 기준이기 때문에 Levenshtein.ratio()에이 값을 전달하고 부정적인 경우에 조기 종료를 기대할 수있는 방법이 있습니까? 초기에 종료 할 수있는 방법이 있으면 런타임을 저장할 수 있습니다. Levenshtein 알고리즘에서 전체 거리를 계산하기 전에 일찍 비율을 구할 수 있습니까?파이썬 퍼지 levenshtein 비율 조기 종료있어?
Levenshtein.ratio('lot of runtime','why not an early exit in this case by taking the intended ratio', 0.9)
중요한 알고리즘 인 경우 왜 파이썬 세부 사항에 관심이 있습니까? 이 모듈 "Levenshtein"이 어떻게 구현되었는지 전혀 모르겠지만, 동적 프로그래밍 구현을 수정하여 완전한 처리 전에 멈출 수는 있습니다. – mmgp
현재 구현에서 지원하지 않는다고 생각합니다. 구현하는 데 곧장 앞으로 나아갈 수 있기 때문에이를 포크하지 않고 지원하도록 변경하지 않을 수도 있습니다. – Abhijit
아아, Levenshtein =='python-Levenshtein'은 C로 작성되었습니다. –