2017-04-05 11 views
0

https://www.socialbakers.com/을 크롤링하고 싶지만 사이트에 로그인 할 때 게시물을 할 때 여러 번 리디렉션을 처리하는 데 문제가 있습니다. 첫 번째 리디렉션은 리디렉션을 수행하는 JavaScript가있는 HTML 페이지입니다.Guzzle, Goutte 및 Symfony 3을 사용하여 여러 리디렉션을 처리하는 방법은 무엇입니까?

모든 리디렉션 요청 URL을 추적하고 각 URL에 게시/요청을 할 수 있는지 추적하고 싶습니다.

답변

1

Goutte는 JS를 지원하지 않으므로 웹 스크레이퍼 입니다.

JS에 익숙하다면 Selenium이나 PhantomJS와 같이 더 강력한 기능이 필요합니다.

PhantomJS를 살펴보면 간단하고 빠릅니다.

Selenium에는 PhantomJS 용 드라이버가 있습니다. PHP로 유지하려는 경우 (Mink을 Selenium 및 PhantomJS와 함께 사용할 수 있음).