cheerio

5열

2답변

dom을 변경하지 않고 일부 숫자를 반환하는 일부 JS API가있는 웹 페이지가 있습니다. 이러한 페이지를 다운로드하고 다운로드 한 페이지의 컨텍스트에서 해당 기능을 실행하는 NodeJS 응용 프로그램을 작성하고 싶습니다. 페이지 스크 레이 핑을 위해 cheerio를 보았습니다.하지만 DOM을 탐색하고 조작하는 것이 얼마나 쉬운지를 보면서 페이지 기능 실행

5열

3답변

xpath 및 cheerio를 사용하여 요소 가져 오기

xpath로 요소를 가져올 node.js 함수를 작성하려고합니다. 제가 xpath = '/html/body/div/div[2]/div/h1/span' 내 DOM은 안녕에로드와 같은 원하는 DOM 요소의 XPath를 가지고 통해 FS 모듈 (I이 웹 페이지는 로컬로 저장되어 있기 때문에) var file = fs.readFileSync("aaa.html"

2열

1답변

Node.js - Cheerio에서 콜백 함수 사용

저는 노드에 스크레이퍼를 구현하고 있습니다.이 노드는 request과 cheerio을 사용하여 페이지를로드하고 구문 분석합니다. 요청 후에 만 콜백을 넣고 Cheerio가 페이지로드를 마쳤습니다. async extension을 사용하려고하지만 콜백을 어디에 둘 것인지 확실하지 않습니다. request(url, function (err, resp, bod

0열

1답변

cheerio 및 node.js를 사용하여 현재 페이지를 긁어 모으는 방법?

이것은 복잡한 질문 일 수 있지만 여기에 있습니다 : 나는 node.js.와 함께 간단한 로컬 호스팅 웹 스크레이퍼를 만들고 있습니다. 소스 파일에서 스크랩 할 URL을 수동으로 정의 할 때 완벽하게 작동하며 사용자에게 선택한 URL을 묻는 중입니다. 그런 다음 빈 div에 입력 한 URL을 추가하고 이상적으로 해당 div의 콘텐츠를 가져 오기 위해 che

1열

1답변

Nodejs & Cheerio를 사용하여 깨진 HTML 코드를 구문 분석

Nodejs & Cheerio를 사용하여 표 형식의 데이터가 포함 된 순수한 정적 HTML 페이지를 긁어 내려고합니다. 그러나 문제는 그 페이지가 적절한 HTML DOM을 가지고 있지 않느냐는 것입니다. 내 말은 닫히지 않은 시작 태그가 많이 있다는 뜻입니다. 구멍이없는 다른 닫는 태그 (</table>)가 있습니다. 샘플 코드 : 사람이 볼 수 있듯이 폐

0열

2답변

cheerio node.js 콜백

'요청'과 'cheerio'를 사용하여 스크래퍼를 작성하려고합니다. 나는 100 개의 URL 배열을 가지고있다. 배열을 반복하고 각 URL에 '요청'을 사용하고 cheerio.load (body)를 수행합니다. 내가 3 이상을 증가 시키면 (즉, 테스트를 위해 < 3으로 변경) 스태커가 손상됩니다. var productNumber가 정의되지 않았으며 정의되