저는 파이썬 difflib 라이브러리를 사용하여 2 개의 문서가 다른 곳을 찾았습니다. Differ(). compare() 메서드는이 작업을 수행하지만 매우입니다. diff 명령과 비교할 때 큰 HTML 문서의 경우 느림 - 적어도 100 배 느립니다.문서가 파이썬과 다른 점 결정
어떻게 파이썬에서 2 개의 문서가 다른지를 효율적으로 판별 할 수 있습니까? (이상적으로는 SequenceMatcher(). get_opcodes()가 반환하는 실제 텍스트 대신 위치에 있습니다.)
2 개의 문서가 여러 위치에서 다를 수 있습니다. – hoju
좋은 지적, 지금 고쳐졌습니다. – Kimvais
문자 대신 줄로 비교하는 것이 좋습니다. 이것은 내가 한 일입니다. 문자 대신 줄을 사용하도록 Differ를 변경하면 효율성이 diff 명령과 유사 해졌습니다! – hoju