처럼 나는 등 여리고, NekoHtml 같은 다양한 HTML 파서를 사용하여 웹 페이지의 HTML 소스 코드를 분석 자바 프로그램 ... 자바
가 지금은 PHP 언어 파서를 개발하고자 개발 된 PHP의 HTML 파서. 시작하기 전에 html 코드를 파싱하기 위해 PHP와 함께 사용할 수있는 html 파서가 있다는 것을 알고 싶습니다.
Q
자바
3
A
답변
2
체크 아웃 DOMDocument. 문서를
<?php
$doc = new DOMDocument();
$doc->loadHTML("<html><body>Test<br></body></html>");
echo $doc->saveHTML();
2
내장 클래스 DOM parser은 매우 훌륭하게 작동합니다. 다른 많은 xml parsers도 있습니다.
1
DOM 만들기
는예 # 1이 꽤 좋다. 그것은 또한 무효 마크 업을 처리 할 수 있지만 불완전한 마크 업의 경우 문서화되지 않은 오류와 예외를 던질 것이므로 DOM으로로드하기 전에 HTMLPurifier 또는 다른 라이브러리로 HTML을 필터링하는 것이 좋습니다.
+1 "HTML 필터가있는 HTML 필터 또는 일부 ..." –