2017-04-08 15 views
0

DomXpath 쿼리를 사용하여 브라우저에서 페이지를 렌더링 할 때 사용자가 볼 수있는 텍스트가 포함 된 파일의 모든 HTML 요소를 찾습니다. 코드의PHP에서 DomXpath를 사용할 때 노드 건너 뛰기

다음 라인은 꽤 잘 트릭을 할 :

$xpath = new DOMXpath($doc); 
$results = $xpath->query("//text()"); 

그러나, 몇 가지 부작용이 있습니다. 당신이 당신의 HTML에

<style> 

태그가있는 경우 예를 들어, 그 안에 읽고 모든 CSS 요소를 분석하고 나는 완전히 무시하고 싶은 것입니다. 하나 이상의 텍스트 요소를 무시하도록 위 쿼리를 작성하는 방법을 찾지 못하는 것 같습니다. 어떤 도움을 주시면 감사하겠습니다.

답변

0

<style> 태그를 피하는 방법을 찾았습니다.

$results = $xpath->query("//body//text()") 

이렇게하면 HTML 파일 본문 앞에있는 내용이 모두 무시됩니다.