2010-05-22 9 views
4

을 찾을 수 있지만 오류가 계속 할 수 없습니다 : Scrapy 내가 scrapy 실행하는 간단한 거미를 얻기 위해 노력 해왔다 거미 오류

Could not find spider for domain:stackexchange.com

내가 표현 scrapy-ctl.py crawl stackexchange.com으로 코드를 실행

. 거미는 다음과 같다 :

다른 사람이 동일한 문제 개월 전 거의 게시하지만 그것을 해결하는 방법을 언급하지 않았다
from scrapy.spider import BaseSpider 
from __future__ import absolute_import 


class StackExchangeSpider(BaseSpider): 
    domain_name = "stackexchange.com" 
    start_urls = [ 
     "http://www.stackexchange.com/", 
    ] 

    def parse(self, response): 
     filename = response.url.split("/")[-2] 
     open(filename, 'wb').write(response.body) 

SPIDER = StackExchangeSpider()` 

, Scrapy spider is not working 내가 정확히 http://doc.scrapy.org/intro/tutorial.html에 turtorial을 다음되었으며, 이유를 알아낼 수 없습니다 작동 안됨. 나는 일식이 코드를 실행하면

나는 그것이 기본 거미 모듈을 찾지 못하는 이유 내가 알아낼 수 없습니다 오류

Traceback (most recent call last): File "D:\Python Documents\dmoz\stackexchange\stackexchange\spiders\stackexchange_spider.py", line 1, in <module> from scrapy.spider import BaseSpider ImportError: No module named scrapy.spider

를 얻을. 내 거미가 scripts 디렉토리에 저장되어야합니까?

+0

내 스파이더에는 규칙 문이 없으므로 적용되지 않는다고 생각합니다. 나는 틀릴 수 있었다. – Kristin

+0

튜토리얼에서 정의한 DmozSpider를 사용할 때 같은 오류가 발생합니까? – unutbu

+0

도메인으로 dmoz를 사용해 보지 않았습니다. 내가 실제로 한 모든 작업은 크롤링하는 사이트를 변경하는 것입니다. – Kristin

답변

2

python yourproject/spiders/domain.py을 실행하여 구문 오류가 있는지 확인하십시오. 나는 친척 수입에 의존하는 치료법으로 절대 수입을 가능하게해야한다고 생각하지 않습니다.

+1

그것은 scrapy.spider 모듈 – Kristin

+0

나중에 찾을 수 없습니다, 첫 번째 문제는 '도메인에 대한 거미를 찾을 수 없습니다 : stackexchange.com'은 치료 메시지이므로, 치료 모듈이 올바르게로드됩니다. 그리고 후자의 문제는 eclipse와 pythonpath와 관련이 있습니다. – Rolando

+1

문제가 해결되었습니다. 다른 컴퓨터에 다시 설치되었습니다. 파일을 잘못 배치했거나 잘못 설치 했어야합니다. – Kristin