나는 Symfony2 구성 요소를 기반으로 PHP 웹 크롤러 인 Goutte을 시험 중입니다. Google을 일반 텍스트 형식과 SSL 형식으로 모두 성공적으로 검색했습니다. 그러나로드되지 않는 ASP/SSL 페이지를 발견했습니다. 여기 Goutte가 ASP SSL 페이지를로드하지 않습니다
내 코드입니다 :잘못된 요청 (잘못된 헤더 이름)
:// Load a crawler/browser system require_once 'vendor/goutte/goutte.phar'; // Here's a demo of a page we want to parse $uri = '(removed)'; use Goutte\Client; $client = new Client(); $crawler = $client->request('GET', $uri); echo $crawler->text() . "\n";
대신, 위의 코드의 끝 부분에있는 에코,이 사이트, 저에게이 있습니다
Firefox에서 사이트를 잘 볼 수 있으며, HTML은 wget --no-check-certificate
을 사용하여 괜찮게 검색 할 수 있습니다 (헤더 또는 사용자 에이전트 설정, 예).
Goutte에 일부 HTTP 헤더를 설정해야한다고 생각합니다. 누구에게 내가 시도해야 할 아이디어가 있습니까?
(:
여기에 전체 코드입니다. 사람이 여기 downvotes에 대해 궁금하면, 나는이 질문은 내가 정당화 편집하거나 내 계정에 대한 보복 downvotes에 대한 번개로드가되었다 의심 downvote 누군가가 싫어한다,이 질문은 복수를 쳤다.) :!)'). – halfer