2017-12-13 19 views
0

참고 : bs4와 lxml은 옵션이 아니므로 타사 모듈을 사용할 수 없습니다.
xml.minidom이 깨진 XML을 구문 분석 할 수 있습니까

파이썬 3 표준 라이브러리로 HTML을 구문 분석해야합니다. xml.minidom 갈 방법이 될 것이라고 생각하지만 그것은 구문 오류와 같은 예외를 throw하지 않고 잘못된 XML/HTML을 구문 분석 할 수있을 것하지 않습니다.

내가 찾고있는 것을 할 수있는 XML 모듈 내에서 뭔가가 누락 되었습니까?

표준 라이브러리에서 뭔가 빠졌습니까? 당신이 깨진 HTML/XML을 처리해야하는 경우

답변

-2

, 나는하는 경우, 당신은 html.parser와 더 나은 기회가, 당신은 정당화 타사 모듈을 사용할 수 없다는 것을 가정 아름다운 수프 4

+0

내가 말했듯이 나는 bs4 또는 다른 제 3 자 모듈을 사용할 수 없다. –

1

을 ckech하는 것이 좋습니다 구문 분석 프로세스에 대한보다 낮은 수준의 제어를 제공합니다.

xml.dom.minidom 저는 일반적으로 깨진 문서를 구문 분석 할 수 없습니다.