으로 바꿉니다. 따라서 site에서 "Videos"와 "English Transcripts"의 다운로드 링크를 추출하는 스파이더를 작성했습니다. cmd를 윈도우에서 나는 모든 올바른 정보가 긁힌 것을 볼 수 있습니다.파이썬 스케이프 - 콜백에서 콜백에서 항목을 CSV
내가 겪고있는 문제는 출력 csv 파일에는 "영어 번역본"링크가 아니라 "비디오"링크 만 포함되어 있습니다 (cmd 창에서 스크랩 된 것을 볼 수 있음에도 불구하고).
다른 게시물에서 몇 가지 제안을 시도했지만 그 중 아무 것도 작동하지 않는 것 같습니다.
다음 그림은 I 출력 모양을하고 싶은 방법입니다 CSV Output Picture
이 내 현재의 거미 코드입니다 : 당신은 항목의 서로 다른 두 종류의 열매를 산출하는
import scrapy
class SuhbaSpider(scrapy.Spider):
name = "suhba2"
start_urls = ["http://saltanat.org/videos.php?topic=SheikhBahauddin&gopage={numb}".format(numb=numb)
for numb in range(1,3)]
def parse(self, response):
yield{
"video" : response.xpath("//span[@class='download make-cursor']/a/@href").extract(),
}
fullvideoid = response.xpath("//span[@class='media-info make-cursor']/@onclick").extract()
for videoid in fullvideoid:
url = ("http://saltanat.org/ajax_transcription.php?vid=" + videoid[21:-2])
yield scrapy.Request(url, callback=self.parse_transcript)
def parse_transcript(self, response):
yield{
"transcript" : response.xpath("//a[contains(@href,'english')]/@href").extract(),
}
가능한 중복 https://stackoverflow.com/questions/41917108/scrapy-csv-output-randomly-missing :
귀하의 예에 적용 -fields) –