나는 웹 사이트를 긁어 내기 위해 치료를 사용하고 있습니다. 긁어 내고 싶은 아이템 페이지는 다음과 같습니다 : http://www.somepage.com/itempage/&page=x. 여기서 x
은 1
부터 100
까지의 숫자입니다. 따라서, 나는 이와 유사한 페이지에 대해 지정된 콜백 함수가있는 SgmlLinkExractor
규칙이 있습니다.치료 - 목록 페이지가 없지만 각 항목 페이지의 URL을 알고 있습니다
웹 사이트에는 모든 항목이 포함 된 목록 페이지가 없으므로 그 URL을 긁어 모으기를 원합니다 (1
에서 100
까지). 이 녀석 here는 같은 문제를 가지고있는 것처럼 보였지만 그것을 이해할 수 없었다.
해결책이있는 사람이 있습니까?