누구든지 텍스트의 부정을 찾을 수있는 라이브러리 또는 소프트웨어를 알고 있습니까? 예를 들어,텍스트 얼룩
1. Name 1, Comment 2. Name 2, Comment 3. Name 3 , Comment 5. Name 10, Comment
이 소프트웨어 또는 라이브러리가 먼저 유사 상품 찾기 것이라고 텍스트의 일부를 (많이 모두 압축 소프트웨어의 조각이 압축 텍스트의 반복 유사한 부분을 인코딩 할 잘라 것 ... 내가 가지고 말할 수)하지만 오류 허용 오차에 대한 변수를 사용하면 텍스트의 비슷한 부분을 찾을 수 있습니다. 이제 텍스트 비교 응용 프로그램이나 diff/merge 도구를 사용하여 실제로 볼 수있는 것을 다른 것으로 강조 할 수 있습니다. 아마도이 도구를 만드는 것에 대해 생각하고 있지만 바퀴를 재발 명하고 싶지는 않습니다. 원격으로이 작업을 수행 할 수있는 곳이 있다면이 프로젝트에 도움이 될지, 아니면 적어도 하나를 만들지는 모르겠다는 것을 알고 싶습니다. 이 대답은 아마도 다른 사람들이 똑같은 일을하는 데 도움이 될 수 있다고 생각합니다. 나는 공급이 충분할 정도로 수요가 높을 것이라고 생각할 것입니다. 그 이유는 무엇이든 찾을 수 없다는 생각이 들기 때문입니다.