내가 (간체) Genshi를 사용하여 다음 파이썬 코드가 있습니다Genshi가 HTML 엔터티를 구문 분석하지 못하게 할 수 있습니까?
with open(pathToHTMLFile, 'r') as f:
template = MarkupTemplate(f.read())
finalPage = template.generate().render('html', doctype = 'html')
소스 HTML 파일은 ©
, ™
및 ®
등의 요소를 포함합니다. Genshi는 이들을 UTF-8 문자로 바꿉니다. 결과적으로 결과 HTML을 보는 뷰어에 문제가 발생합니다 (출력은 독립 실행 형 파일로 사용되며 웹 요청에 대한 응답이 아닙니다). Genshi가이 엔티티들을 파싱하는 것을 막을 수있는 방법이 있습니까? &
과 같은 일반적인 것들은 잘 통과합니다.