2012-08-28 2 views
3

SGML을 사용하여 구조화 된 일부 문서가 있고이 구조를 설명하는 DTD 파일이 있습니다.SGML Parser for Python 3?

이 데이터를 구문 분석하기 위해 누군가 Python-3 호환 라이브러리 나 모듈을 권장 할 수 있습니까? Python 2.x의 경우 Google-fu는 SGMLParser으로 보이지만 현재는 더 이상 사용되지 않습니다 (Py3k에서 완전히 삭제되었습니다).

많은 사람들이 lxml을 제안하는 것으로 보이지만, 종속성 문제로 인해 나를위한 옵션이 아닙니다.

BeautifulSoup은 지저분한 마크 업에 적합하지만 A) 마지막으로 py3k와 호환되지 않는다고 들었습니다. B)이 콘텐츠는 구조가 잘되어 있습니다.

답변

1

BeautifulSoup은 (는) 더 이상 사용되지 않습니다. 호환 Py3k되는 대신 교체 사용