0
일부 정보를 긁어 내기 위해 www.geocaching.com에서 HTML 웹 페이지를 다운로드하고 싶습니다. 그러나 내가 다운로드하고자하는 웹 페이지는 사용자가 로그인했는지 여부에 따라 두 가지 방법으로 표시됩니다. 사용자가 로그인 한 경우에만 정보를 찾을 수 있습니다.비밀번호 포털을 통해 html을 다운로드하십시오.
이전에는 download.file()
을 사용했습니다. mapply()
은 (geocache_link_list
) URL 목록에서 HTML 파일을 다운로드하고 다음과 같이 다른 목록 (geocache_name_list
)를 사용하여 이름을 지정합니다 :
mapply(function(x,y) download.file(x,y), geocache_link_list, geocache_name_list)
을하지만,이 페이지에 비 로그인 다운로드합니다.
는 또한RCurl
을 사용하려고하지만,이 또한 페이지에서 비 로그인 다운로드 그래서 나는 mapply 기능에 통합하려고 시도하지 :에서 브라우저를 실행하는 방법이 있나요
library(RCurl)
baseurl <- geocache_link_list[1]
un <- readline("Type the username:")
pw <- readline("Type the password:")
upw <- paste(un, pw, sep = ":")
R 내에서 RSelenium
또는 RCurl
과 같은 것을 사용하여 로그인 세부 정보를 입력 한 다음 원하는 페이지로 리디렉션하고 다운로드하십시오.