2017-12-26 20 views
0

Apache Nutch Crawler의 깊이를 설정하는 방법은 무엇입니까? 명령 아래Apache Nutch Crawler 설정 깊이

크롤링이되지 않습니다 말한다 : 나는 빈/크롤 대신 기어와 노력

bin/nutch crawl seed.txt -dir crawler/stat -depth 1 -topN 5 

. 그 때문에 오류가 발생합니다 :

class cannot be loaded : bin.crawl

답변

0

정말로 최대 깊이를 설정하려면 채점 깊이 플러그인을 사용해야합니다. 크롤링 스크립트를 사용하면 깊이의 상한선이지만 반복되는 반복 횟수를 정의 할 수 있습니다. 크롤링 명령에 대한 올바른 형식은 다음과 같습니다

bin/crawl -s seed.txt crawler/stat 1 

다른 Nutch 스크립트와 마찬가지로, 단순히 그것을 사용하는 방법을 설명하는 도움말 메시지를보고 매개 변수없이 빈/크롤링을 실행합니다.