urllib3을 사용하여 웹을 크롤링하고 있습니다. 예제 코드 :파이썬 | HTTP - 다운로드하기 전에 파일 크기를 확인하는 방법
from urllib3 import PoolManager
pool = PoolManager()
response = pool.request("GET", url)
문제는 내가 정말 큰 파일의 다운로드 내가 그것을 다운로드에 interseted하고 있지 않다 URL을 우연히 발견 할 수 있다는 것이다.
이 질문은 Link입니다. urllib
및 urlopen
을 사용하는 것이 좋습니다. 나는 서버에 두 번 연락하고 싶지 않다.
파일 크기를 25MB로 제한하고 싶습니다. urllib3
으로이 작업을 수행 할 수있는 방법이 있습니까?
25MB를 치고 다운로드를 취소 할 때까지 읽으시겠습니까? – jarmod
그것은 옵션입니다. 내가 어떻게 할 수 있니? –
HTTP HEAD verb를 사용하고 Content-Length 머리글을 읽으면 크기를 검색 할 수 있습니다. 서버가 Content-Length를 생략하면 jarmod가 언급 한대로 파일 다운로드를 시작하지 않는 한 크기를 확인할 방법이 없습니다. –