dom을 변경하지 않고 일부 숫자를 반환하는 일부 JS API가있는 웹 페이지가 있습니다. 이러한 페이지를 다운로드하고 다운로드 한 페이지의 컨텍스트에서 해당 기능을 실행하는 NodeJS 응용 프로그램을 작성하고 싶습니다. 페이지 스크 레이 핑을 위해 cheerio를 보았습니다.하지만 DOM을 탐색하고 조작하는 것이 얼마나 쉬운지를 보면서 페이지 기능 실행
xpath로 요소를 가져올 node.js 함수를 작성하려고합니다. 제가 xpath = '/html/body/div/div[2]/div/h1/span'
내 DOM은 안녕에로드와 같은 원하는 DOM 요소의 XPath를 가지고 통해 FS 모듈 (I이 웹 페이지는 로컬로 저장되어 있기 때문에) var file = fs.readFileSync("aaa.html"
저는 노드에 스크레이퍼를 구현하고 있습니다.이 노드는 request과 cheerio을 사용하여 페이지를로드하고 구문 분석합니다. 요청 후에 만 콜백을 넣고 Cheerio가 페이지로드를 마쳤습니다. async extension을 사용하려고하지만 콜백을 어디에 둘 것인지 확실하지 않습니다. request(url, function (err, resp, bod
이것은 복잡한 질문 일 수 있지만 여기에 있습니다 : 나는 node.js.와 함께 간단한 로컬 호스팅 웹 스크레이퍼를 만들고 있습니다. 소스 파일에서 스크랩 할 URL을 수동으로 정의 할 때 완벽하게 작동하며 사용자에게 선택한 URL을 묻는 중입니다. 그런 다음 빈 div에 입력 한 URL을 추가하고 이상적으로 해당 div의 콘텐츠를 가져 오기 위해 che
Nodejs & Cheerio를 사용하여 표 형식의 데이터가 포함 된 순수한 정적 HTML 페이지를 긁어 내려고합니다. 그러나 문제는 그 페이지가 적절한 HTML DOM을 가지고 있지 않느냐는 것입니다. 내 말은 닫히지 않은 시작 태그가 많이 있다는 뜻입니다. 구멍이없는 다른 닫는 태그 (</table>)가 있습니다. 샘플 코드 : 사람이 볼 수 있듯이 폐
'요청'과 'cheerio'를 사용하여 스크래퍼를 작성하려고합니다. 나는 100 개의 URL 배열을 가지고있다. 배열을 반복하고 각 URL에 '요청'을 사용하고 cheerio.load (body)를 수행합니다. 내가 3 이상을 증가 시키면 (즉, 테스트를 위해 < 3으로 변경) 스태커가 손상됩니다. var productNumber가 정의되지 않았으며 정의되