scrapy

-2열

3답변

Python/Scrapy 핸들 테이블 데이터 누락, 범위를 벗어난리스트 인덱스

테이블의 크기를 알려주는 컬럼에 데이터가 항상 있기 때문에 목록 길이로 round-col을 사용합니다. 모든 필드가 일치해야하므로 데이터를 고칩니다.하지만 루프가 '데이터 없음'에 도달하면 목록 인덱스가 범위를 벗어나거나 'TypeError :'NoneType '개체가 스크립트 가능하지 않습니다. from scrapy.selector import Selec

0열

1답변

스크랩 된 각 제품에 대해 1 씩 증가하는 일련 번호와 같은 비단뱀 스크랩 출력에 필드를 추가하려고합니다.

스크랩을 사용하여 웹 사이트를 스크랩하려고합니다. 이 일련 ID가 증가한다 긁어내는 각 제품에 대해, "3001" 을 : 나는 데이터를 스크랩 할 수 있어요 하지만 은 내가 "직렬 ID"같은 OUPUT 에 추가 필드를 추가 할 1 일까지, 3002, 3003, 3004과 같은 ............. 내가 내용 [ 'URL']와 같은 오류를 얻고있다 위의

0열

1답변

어떻게하면 치료 경로 CrawlSpider로 상대 경로를 절대 경로로 변환 할 수 있습니까?

나는 Scrapy를 처음 사용하고 있으며 현재 Tor darknet에서 포럼을 크롤링 할 CrawlSpider를 작성하려고합니다. 현재 내 CrawlSpider 코드는 다음과 같습니다 : 포럼 상대 경로를 사용 import scrapy from scrapy.spiders import CrawlSpider, Rule from scrapy.linkextra

1열

2답변

빈 공간을 제외한 치료

나는 긁힌 자국이있는 링크 (https://www.century21.com/real-estate/rock-spring-ga/LCGAROCKSPRING/)를 시도했다. 나는 그것으로부터 "침대"데이터를 추출하고 싶었다. 그 안에 일부 집에 대한 몇 가지 빈 세부 정보가 있기 때문에 몇 가지 "침대"세부 정보 만 추출됩니다. 그러나 나는 모든 것에 대한 세부

0열

1답변

Scrapy를 사용하여 로그인하지 못했습니다.

나는 scrapy를 사용하여 사이트에 로그인하려고합니다. 나는 예제 사이트를 가져 와서 확인했다. 해당 사이트에서 작동하고 있습니다. 그런 다음 다른 사이트를 방문하여 확인했습니다. 작동하지 않습니다. 방금 URL을 변경하고 코드를 실행했습니다. 하지만 일하지 않아. 무엇이 문제일까요? # -*- coding: utf-8 -*- import scrapy

0열

1답변

Scrapy : 모듈 이름이 'parsel'

많이 찾았지만 이에 대한 해결책을 찾지 못했습니다. 내가 parsel라는 이름의 모듈을 찾을 수 없습니다 Traceback (most recent call last): File "/usr/local/bin/scrapy", line 7, in from scrapy.cmdline import execute File "/usr/local/lib/python3.4

1열

2답변

Scrapy에서 모든 http 요청을 수신 할 수 없음

사이트에 액세스하려고 시도하고 사이트 내의 페이지로 리디렉션되는 링크가 없는지 확인합니다. 사이트 맵을 사용할 수 없기 때문에 Scrapy을 사용하여 사이트를 크롤링하고 모든 페이지의 모든 링크를 가져 오지만 모든 링크와 상태 코드가 포함 된 파일을 출력 할 수는 없습니다. 내가 코드를 테스트하기 위해 사용하고이 사이트는 quotes.toscrape.com

-2열

1답변

xpath를 사용하여 비슷한 속성을 얻으려면 어떻게해야합니까?

<div><a src="What I need" data-src="What I don't need">Demo</a></div> 나는이 XPath는 ("./ DIV/A/@의 SRC")를 시도하고, 그러나 그것은 나에게이 모든 것을 줄 것이다,하지만 난 싶지 않아 @ data-src, 어떻게해야합니까 ??? 원시 페이지는 여기에 있습니다 : the raw pag

0열

1답변

Scrapy JSON 출력 - 값이 공백입니다.

scrapy를 사용하여 일련의 웹 페이지를 크롤링하고 싶습니다. 그러나 일부 값을 json 파일에 쓰려고하면 해당 필드가 표시되지 않습니다. import scrapy class LLPubs (scrapy.Spider): name = "linlinks" start_urls = [ 'http://www.linnaeuslink.o

0열

1답변

결합 문자열 Scrapy python

내 json 출력이 더 깨끗해 지도록 치료를 사용할 때 값 집합을 결합하는 방법에 대한 질문이 있습니다. 다음은 내가 가지고있는 것입니다. import scrapy from scrapy.contrib.loader import ItemLoader from scrapy.contrib.loader.processor import TakeFirst, MapCom