웹 페이지에서 데이터를 스크랩하려고합니다. 웹 페이지는 모든 페이지가 될 수 있습니다. 예를 들어, curl
을 사용하여 http://www.google.com/
을 긁어 모으고 있습니다. 그것은 많은 경고를 주며 아무것도하지 않습니다.잘 작성되지 않은 웹 페이지의 데이터 스크랩
경고 : 경고 라인 (30)에 SimpleXMLElement는 :: __) (구성 : C에서 : \ WAMP \ www가 \ nbacurl \
index.php에이 오류가 여러 번 반복했다.
나는 simplehtmldom에 대해 들었지만 다운로드했지만 사용 방법을 모르고있다. 구문 분석 할 페이지가 있지만 출구를 찾을 수 없습니다. 이것은 작동하지 않는 아주 간단한 코드입니다.
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.google.com');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$contents = curl_exec ($ch);
$xml = new SimpleXMLElement($contents);
echo '<pre>' , print_r($xml) , '</pre'>;
시도 (거기에서 최선이 아니다) [phpQuery] (HTTP ://code.google.com/p/phpquery/) –
감사합니다. Damien, 'simplehtmldom'을 사용하려고했지만 나에게 적합하지 않았습니다. 그래서 저는 4 줄의 곱슬 곱슬과 xml 곱셈을 가진 아주 기본적인 것으로 옮겼습니다. –
그리고 내가 부탁을 들어, 내가 phpQuery에 새로운, wht 실제로합니까? 자사의 jQuery와 같은 함수를 만들고 거기에 내장 함수를 호출하는 곳 ?? 아니면 다른 것입니까? 고마워요 –