간단한 HTML DOM과 XPath를 사용하여 웹 사이트 페이지를 크롤링하고 특정 텍스트를 검색하려고했습니다. 나는 웹 사이트에서 모든 링크를 얻었고 모든 페이지에서 해당 링크와 검색 텍스트를 크롤링하려고합니다. 내가 검색하고자하는 텍스트는 html span 태그 내에 있습니다.
그러나 출력이 표시되지 않습니다.DOM을 사용하여 특정 텍스트 검색 XPath
뭐가 잘못 됐나요?
여기 난 그냥 확인하려면 내 코드
<?php
include_once("simple_html_dom.php");
set_time_limit(0);
$path='http://www.barringtonsports.com';
$html = file_get_contents($path);
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for($i = 0; $i < $hrefs->length; $i++){
$href = $hrefs->item($i);
$url = $href->getAttribute('href');
$nurl = $path.$url;
$html1 = file_get_contents($nurl);
$dom1 = new DOMDocument();
@$dom1->loadHTML($html1);
$xpath1 = new DOMXPath($dom1);
$name = $xpath1->evaluate("//span[contains(.,'Asics Gel Netburner 15 Netball Shoes')]");
if($name)
echo"text found";
}
?>
입니다 텍스트 "아식스 젤 Netburner 15 넷볼 신발"웹 사이트 www.barringtonsports.com 여부의 모든 페이지에 존재 여부.
명령 줄에서 스크립트를 실행하는 방법은 무엇입니까? –