다운로드 할 500 개의 링크가 있으며 예를 들어 10 개의 항목별로 배치 할 수 있습니다.luigi 일괄 처리 모듈이 직선 일괄 처리입니다. 작업
이 의사 코드는 어떻게 될 것입니까?
class BatchJobTask(luigi.Task)
items = luigi.Parameter()
def run(self):
listURLs = []
with ('urls_chunk', 'r') as urls
for line in urls:
listURLs.append('http://ggg'+line+'.org')
10_urls = listURLs[0:items] #10 items here
for i in 10_urls:
req = request.get(url)
req.contents
def output(self):
return self.LocalTarger("downloaded_filelist.txt")
class BatchWorker(luigi.Task)
def run(self)
# Here I should run BatchJobTask from 0 to 10, next 11 - 21 new etc...
어떻게 될까요?
귀하의 URL 목록은 어디에 있습니까? – MattMcKnight
첫 번째 게시물 – GarfieldCat
을 업데이트했습니다.이 URL 목록은 어디에 저장 되었습니까? 큐, 데이터베이스, 파일? 당신이해야 할 일은 그 일에 얼마나 많은 사람들이 있는지를 알아 내고 그곳에서 당신의 덩어리를 만드는 것입니다. 아래에 예제를 만들 겠지만 문제의 관련 부분을 지정하지 않았으므로 문제와 관련성이 낮습니다. – MattMcKnight