0
나는 웹 스크랩을 학습하고 https://www.kununu.com/us/google1/reviews에서 정보를 긁어 내려고합니다.페이지 끝에 "추가로드"옵션이있는 경우 rvest를 사용하여 데이터 스크랩
여기 내 코드입니다 : RM (목록 = 1!())
library(httr)
library(rvest)
library(xml2)
library(curl)
url <- "https://www.kununu.com/us/google1/reviews"
reviews <- url %>%
read_html() %>%
html_nodes(".panel-body")
quote <- reviews %>%
html_nodes("h2 a") %>%
html_text()
rating <- reviews %>%
html_nodes(".tile-heading") %>%
html_text()
date <- reviews %>%
html_nodes("strong") %>%
html_text()
a <- data.frame(quote, rating, date, stringsAsFactors = FALSE)
그러나, 위의 코드 긁힌 자국 첫 번째 열 몸. 동적 인 웹 사이트를위한 RSelenium 패키지에 관한 몇 가지 제안을 인터넷에서 발견했습니다. 불행히도 checkForServer()를 사용하고 startServer() 명령을 사용하면 내 컴퓨터에서 오류가 발생합니다. LOAD MORE 옵션이 바닥에있을 때 한 장의 모든 56 개 리뷰를 고칠 생각은 없습니까?
감사합니다. –