2017-12-23 20 views
0

인기있는 옥션 웹 서비스에서 Goutte 목록을 통해 근근히 다가 가려고하지만 코드 조각은 javascript로 렌더링되며 문제는 Goutte가 JS 작업없이 DOM 만 반환한다는 것입니다. 교향곡이 헤드리스 브라우저라면 전체 내용이 렌더링 될 때까지 긁어 모으기를 기다리는 것이 좋을까요? 나는 정상 phantomjs을 확인,하지만 난 Goute에서 그 능력 ..스크랩 Goutte 및 전체로드 대기

답변

0

발견 적이 https://github.com/FriendsOfPHP/Goutte

Goutte는, 그것이 바로 컨텐츠를 다운로드하고 구문 분석 헤더없는 브라우저 아닌 자바 스크립트 구문 분석하지 않습니다

자바 스크립트를 실행하지 않고.

기술 정보

Goutte은 다음과 미세 PHP 라이브러리 주위에 얇은 래퍼 :

심포니 구성 요소 : BrowserKit, CssSelector 및 DomCrawler; Guzzle HTTP 구성 요소.

+0

불쌍한 점으로, symophony가 WebKit에 구축 되었기 때문에 Phantomjs와 비슷한 기능을 가지고 있습니다. 여기에는 continus 문제가 있습니다. –

+0

웹킷을 기반으로하지 않습니다. 그것은 완전히 PHP에서 빌드하고 자바 스크립트를 렌더링하는 전체 브라우저가 필요하지 않습니다. 귀하의 질문에 대한 대답이 유효하면 답을 받아 들일 수 있습니까? – albert

+0

Symfony가 JS를 지원하지 않는다는 설명을 문서에서 이미 보았습니다.하지만 클릭 할 때의 JS와 같은 동작에 대한 것이라고 생각했습니다. 작업하는 동안 의심스러워졌고 지금 당신의 도움으로 내가 할 수있는 확신을 얻었습니다. 내가 Goutte로 할 수있는 일을하지 마라 .-- (흠, 나는 nodejs로 돌아 간다, 너의 도움을 위해 대단히 감사한다. –