헤드리스 셀렌을 사용하여 이미지가 포함 된 웹 사이트를 긁어 내려고했습니다. 처음에는 웹 사이트가 50 개의 이미지를 채 웁니다. 아래로 스크롤하면 점점 더 많은 이미지가로드됩니다.헤드리스 셀렌이있는 HTMLUNIT
윈도우 7 64
파이썬 2.7
최근 다음과 같이 셀레늄 웹 사이트를 탐색 셀레늄
[1] 비 헤드리스
의 설치 : 누구 경우 (
from selenium import webdriver
browser = webdriver.Firefox()
browser.get(url)
browser.execute_script('window.scrollBy(0, 10000)')
browser.page_source
이 작동 알려 주시기 바랍니다).
끝까지 도달 한 다음 소스 페이지를 가져올 때까지 scrollBy()까지 계속 진행할 수 있습니다. HtmlUnit과
from selenium import webdriver
driver = webdriver.Remote(desired_capabilities=webdriver.DesiredCapabilities.HTMLUNIT)
driver.get(url)
와
[2]은 헤드리스 I이 머리가없는 환경에서 scrollBy()를 사용할 수 없다.
이런 종류의 페이지를 긁는 방법에 대한 제안 사항이 있으십니까? 감사합니다.
자바 스크립트는 연구 및 구현 및 작동하고있다;
HTMLUNITDRIVERWITHJS
이 가능하고 신속하다javascript
로 사용. 비슷하지만 자바 스크립트 구현이 다른 웹 페이지의 시간을 절약하기 위해 Selenium HTMLUNIT을 사용할 수 있는지 알고 싶었습니다. – user1460015