difflib

    6

    1답변

    대소 문자를 무시하도록 difflib.get_close_matches()를 어떻게 호출 할 수 있습니까? 나는 대문자를 포함하는 정의 된 형식을 가진 사전을 가지고있다. 그러나 테스트 문자열은 전체 대문자가 있거나 대문자가 없을 수 있으며 동등해야합니다. 그러나 결과를 올바르게 대문자로 입력해야하므로 수정 된 사전을 사용할 수 없습니다. import dif

    0

    1답변

    나는 fuzzywuzzy으로 실험 중이 었으며 많은 경우에 잘못된 결과가 발생했습니다. 디버깅을 시도하고 설명하기 어려운 get_matching_blocks()를 사용하여 시나리오를 만났습니다. get_matching_blocks()는 삼중 튜플을 반환해야한다 내 이해 (I, J, N) 인덱스 i에서 제 문자열 길이 n의 서브 문자열 길이의 서브 스트링과

    0

    3답변

    글쎄 두 문자열을 비교하거나 최소한 문자열에서 다른 문자열로 문자 시퀀스를 찾아야합니다. 두 문자열은 md5 파일을 포함하고 있습니다. 내 현재 코드는 다음과 같습니다 def comparemd5(): origmd5=getreferrerurl() dlmd5=md5_for_file(file_name) print "original md

    5

    2답변

    나는 유사성을 찾으려는 문자열이 많습니다 (각 문자열은 평균 30 자입니다). 나는 간단하고 결과가 좋았으므로 difflib'sSequenceMatcher이이 작업에 유용하다는 것을 알았습니다. 내가이 >>> sm=SequenceMatcher(lambda x:x=='-','hellboy','hell-boy') >>> sm.ratio() 0: 0.9333

    3

    1답변

    나는 그것이 그러나 테이블 html_diff = difflib.HtmlDiff() print html_diff.make_table(previous_contents, fetch_url.page_contents) 하게 그러나 때, (웹 사이트에서 HTML) 텍스트의 두 세트를 사용하여 함수를 호출의 difflib.HtmlDiff 클래스를 사용하고 그 단지

    2

    2답변

    이 두 가지가 다른 비율을 반환하는 이유를 아는 사람이 있습니까? >>> import difflib >>> difflib.SequenceMatcher(None, '10101789', '11426089').ratio() 0.5 >>> difflib.SequenceMatcher(None, '11426089', '10101789').ratio() 0.62

    5

    1답변

    파이썬으로 두 개의 간단한 문자열 사이의 차이점을 강조하고 HTML 부분 속성에 다른 부분 문자열을 묶어야합니다. 그래서 다음의 예에 의해 설명 된 기능을 구현하는 간단한 방법을 찾고 있어요 : hightlight_diff('Hello world','HeXXo world','red') 를 ... 그것은 문자열을 반환해야합니다 : 내가 검색 좀 'He<spa

    2

    1답변

    두 파일을 비교하려면 difflib.HtmlDiff을 사용하고 있습니다. 차이점을 출력 된 html로 강조하고 싶습니다. 한 줄에 두 개의 서로 다른 문자의 최대있을 때 이 이미 작동합니다 a = "2.000" b = "2.120" 그러나에 (다음 출력 라인 전체가 빨간색으로 표시되어 한 줄에 이상의 서로 다른 문자가있는 경우 왼쪽) 또는 녹색 (테이

    3

    1답변

    difflib 라이브러리를 시험 중이다. L_1과 L_2 문자열이 포함 된 두 개의 목록이 있습니다. 나는 그 서열이 비슷하다면 (순서는 중요하지 않음) 알고 싶다. L_1 = ["Bob", "Mary", "Hans"] L_2 = ["Bob", "Marie", "Háns"] 확인해야합니다. 하지만 L_1 = ["Nirdosch", "Mary", "Ro

    2

    1답변

    두 XML 간의 차이점을 시각화 할 수있는 웹 도구를 만들려고합니다. difflib은 차이점이있는 html을 만드는 데는 꽤 효과적 이었지만, 일부 유니 코드 텍스트가 XML에 나타 났으며 결과 HTML에는 html로 인코딩 된 문자가 포함되었습니다. 이 문제에 대한 다른 접근 방법이 있습니까?