python
  • string
  • nlp
  • difflib
  • 2017-11-28 16 views 0 likes 
    0

    difflib를 사용하여 두 문자열 사이의 문자 차이를 확인하는 방법에 관한 많은 스레드가 있지만 특히 단어 삭제 및 두 문자열 사이에 추가 할 수있는 방법이나 모듈이 있는지 알고 싶습니다. 예를 들어추가되거나 삭제 된 단어를 파이썬의 두 문자열로 계산하는 방법은 무엇입니까?

    , 우리는 내가 "이"을 "은"포함하는 목록을 반환

    deleted_words(foo, bar) 
    

    의 라인을 따라 기능이 있는지 알고 싶습니다

    foo = 'This is a sentence' 
    bar = 'I am a sentence' 
    

    이있는 경우.

    이 기능이있는 모듈이 있습니까? 아니면이 모듈을 직접 만들어야합니까?

    +0

    당신은 요구 사항을 설명하는 훌륭한 일을하지 못했습니다 ... 그러나 당신은 아마도 당신 자신의 솔루션을 개발해야 할 것 같은데요. –

    답변

    1

    설명하는 것과 같은 API가 필요한 경우 설명하는 것과 정확히 일치하는 API가 필요하다면 직접 작성해야 할 수도 있습니다.

    그러나 두 개의 텍스트 본문을 구분하는 모듈이 있습니다 (예 : diff-match-patch).

    하나의 간단한 예는 다음과 같습니다

    diff_main("Good dog", "Bad dog") => [(-1, "Goo"), (1, "Ba"), (0, "d dog")] 
    

    그리고 주제에 대한 Google 코드의 위키에 대한 직접 링크 : https://code.google.com/archive/p/google-diff-match-patch/wikis/API.wiki

    가이 SO 자체에이 라이브러리의 더 광범위한 설명 : https://stackoverflow.com/a/16086633/3084820

     관련 문제

    • 관련 문제 없음^_^