3
SGML을 사용하여 구조화 된 일부 문서가 있고이 구조를 설명하는 DTD 파일이 있습니다.SGML Parser for Python 3?
이 데이터를 구문 분석하기 위해 누군가 Python-3 호환 라이브러리 나 모듈을 권장 할 수 있습니까? Python 2.x의 경우 Google-fu는 SGMLParser으로 보이지만 현재는 더 이상 사용되지 않습니다 (Py3k에서 완전히 삭제되었습니다).
많은 사람들이 lxml
을 제안하는 것으로 보이지만, 종속성 문제로 인해 나를위한 옵션이 아닙니다.
BeautifulSoup
은 지저분한 마크 업에 적합하지만 A) 마지막으로 py3k와 호환되지 않는다고 들었습니다. B)이 콘텐츠는 구조가 잘되어 있습니다.