scrapy

0열

2답변

작은 코드에서이 작업을 수행 할 수있는 방법이 있습니까? spider.py ... handle_httpstatus_list = [301,302,303,305,307,308,400,403,404] ... item['redirects'] = 0 if response.status == 301 or response.s

0열

1답변

Scrapy를 사용하여 쇼핑몰 데이터 크롤링

쇼핑 웹 사이트를 크롤링하려고합니다. [u'<div class="subcategory-title"><span class="placeholder"></span></div>'] 그러나 페이지의 소스 코드에 (크롬 개발자 도구를 사용하여 본), 나는이를 볼 수 있습니다 이 response.xpath('//*[@id="content"]/div[2]/div/di

0열

1답변

매김

I가 검색 결과의 페이지에서 각 기사의 모든 링크를 얻으려면 사용 GEO의 데이터 집합에서 검색 결과의 URL 링크를 가져 오기 : https://www.ncbi.nlm.nih.gov/gds/?term=lung+cancer 을하지만 문제는 다음 페이지의 URL을 받고있다. <div class="pagination">에서, 그것은 말한다 : 심지어 내가 경우

0열

1답변

scrapy.Request()에 추가 인수 전달

사실 특정 웹 사이트와 관련된 모든 데이터 (텍스트, 외부 참조, 이미지)를 단일 폴더에 저장하려고합니다. 그렇게하려면 해당 폴더의 경로를 전달해야합니다 yield scrapy.Request(url=url,dont_filter=True, callback=self.parse,errback = self.errback_function,kwargs={'path':

-3열

2답변

주어진 웹 사이트에서 소셜 정보를 추출하는 방법은 무엇입니까?

내가 www.example.com처럼 웹 사이트 URL이 내가 좋아하는이 웹 사이트에서 사회적 정보를 수집 할 : 등 페이스 북의 URL (facebook.com/example), 트위터 URL (twitter.com/example) 웹 사이트의 어느 페이지에서나 사용할 수있는 경우. 이 작업을 완료하는 방법 은 어떤 자습서, 블로그, 기술을 ... 제안

-1열

1답변

Scrapy 크롤링 처리하는 방법 (302) 상태,

import scrapy class Pttscrapper2Spider(scrapy.Spider): name = 'PTTscrapper2' allowed_domains = ['https://www.ptt.cc'] start_urls = ['https://www.ptt.cc/bbs/HatePolitics/index.html/']

-1열

1답변

Scrapy를 사용하여 모든 Quora 응답을 다운로드하려면 어떻게해야합니까?

Scrapy을 사용하여 Quora 답변을 다운로드하려고하지만 내 페이지를 다운로드 할 수없는 것 같습니다. 이 오류 2017-10-05 22:16:52 [scrapy.utils.log] INFO: Scrapy 1.4.0 started (bot: quora) 2017-10-05 22:16:52 [scrapy.utils.log] INFO: Overridden

0열

1답변

스팸 맞춤 지연을 만드는 방법

내 코드에서 전역 지연이 비효율적이기 때문에 맞춤 지연을 만들고 싶습니다. 내가이 스레드에서 무엇을 찾고 있었는지 알 수 없으므로 scrapy is slow (60 pages/min) 나는 새로운 질문으로 질문하는 것이 더 좋습니다. 기본적으로 난이 : amazon request API request API request 나는 그것있는 같이 DOWN

0열

1답변

pip Python 3에 Python 모듈을 설치했지만 해당 모듈에 Python 2가 필요한 종속성 패키지가 있습니다.

그래서 저는 Python을 처음 접했고 개인적인 프로젝트를 수행하는 것이 무엇인지 배우는 좋은 방법입니다. 내 Windows 그래서 나는 단편적인 모듈을 사용할 필요가 환경을 을 포함 virtualenv를 사용하여 : hachoir-metadata가 Python2 의존 패키지이기 때문에 pip install scrappy Collecting scrappy

0열

1답변

상자에 넣은 상자에 후행 쉼표를 추가하십시오.

alist이라는 목록이 있는데, 상자에서 쉼표를 뒤에 추가하는 방법은 무엇입니까? alist = [1,2,3,4,5,...,100] list_wanted = [1,2,3,4,5....,100,] 마지막 쉼표가있는 경우에만 마지막 요소를 인식하는 치료법에 목록을 맞추기 위해 후행 쉼표가 필요합니다. 감사합니다.