2011-04-11 3 views
2

두 XML 간의 차이점을 시각화 할 수있는 웹 도구를 만들려고합니다. difflib은 차이점이있는 html을 만드는 데는 꽤 효과적 이었지만, 일부 유니 코드 텍스트가 XML에 나타 났으며 결과 HTML에는 html로 인코딩 된 문자가 포함되었습니다.파이썬을 사용하여 유니 코드로 XML을 보냄

이 문제에 대한 다른 접근 방법이 있습니까?

+0

HTML의 XML 및 HTML 인코딩 문자에서 유니 코드가 잘못되었습니다. 그게 너를 왜 막는거야? – JosefAssad

답변

1

나는 당신이 귀찮은 것을 'html characters entities'라고 가정하고 수치 대응 물이 아닌 것으로 가정합니다. 예를 들어지도를 다시 매핑 할 수 있습니다. regexes (예 : sed)를 지원하는 좋아하는 cli 도구와 unicode e-workers 또는 reference의 표를 사용합니다. 수치 엔티티 인코딩은 html과 xml 파일에서 비슷하게 사용될 수 있습니다.

감사합니다, 카스텔