9
나는 Perl의 WWW :: Mechanize :: Firefox와 함께 사용 된 MozRepl의 경이로움에 대해 소개되어 왔으며 GWT를 크롤링하는 방법을 알아 내려고 노력했다. 페이지 (예 : : https://www.google.com/offers/home#!details/4bc7fd6bd3feb311/XYW81TXGLA88TR42)MozRepl과 Mechanize :: Firefox로 HTML 렌더링하기
내가 실제로 원하는 것은 실제 HTML이 아닌 렌더링 된 HTML입니다. 내가 어떻게 이것을 얻을 수 있는지에 대한 예를 정말로 고맙게 생각할 것입니다.
예를 들어 페이지를 렌더링 할 수있는 것처럼 보입니다. $ mech-> xpath ('// * [@ id = "goh-content-container"]', one => 1) {innerHTML}; 이상하게도 tho는 일관되게 작동하지 않는 것 같습니다. 때로는 아무것도 출력하지 않으며, HTML을 출력 할 때도 있습니다. 왜 일관되게 산출물을 제공하지 않는지에 대한 아이디어가 있습니까? –
추가 정보 : 단일 크롤러를 실행하면 일관되게 출력되는 것처럼 보이지만 MozRLpl과 상호 작용하는 다중 출력이 일관성있게 생성되지 않은 것으로 보입니다. Ubuntu 11.04와 Firefox 7.0.1에서 실행 –