2017-04-08 7 views
1

저는 오프라인 브라우징을 위해 2 개의 레이어가있는 웹 사이트를 다운로드하는 프로젝트를 진행하고 있습니다.파이썬에서 오프라인 브라우징을위한 웹 사이트를 다운로드하십시오.

내가 CSS, JS, 이미지의 문제에 직면하고있어 있지만,

지금 내 인덱스 html 파일 저장 코드는 HREF 문제를 방지하기 위해 절대에 대한 모든 링크를 변경합니다.

하지만 오프라인으로 찾아보기 위해을 실행하면 이 아닙니다.

내 질문은 어떻게하면 오프라인 브라우징을위한 웹 사이트의 2 레이어를 다운로드하고 모든 CSS, JS 및 전체 온라인 브라우징을위한 storge 스크립트를 작성할 수 있습니까?

추신. 요청을 사용하여 로컬로 파일을 쓸 수는 있지만 올바른 폴더에 저장하는 방법은 알고 있습니까? 예. /far/boo/image.png 또는 /far/boo/css.css

+0

많은 애드온 그런 페이지 아카이버 이미있다, 스크랩북 –

+0

당신이 당신의 자신의 버전, 또는 당신이 할 것을 위해 그 일을 LIB 일부 파이썬을해야합니까? 나는 'wget'에 대해 얘기하고 있습니다. –

+0

@RITESHARORA 그것은 내가 찾고있는 것이 아니라 감사합니다. @AndrewCherevatkin 저는'wget'을 찾고 있었지만 제 사용에는 적합하지 않습니다. ( –

답변

0

위의 의견을 보내 주셔서 감사합니다. 내 대답을 찾으십시오.

결국 루프를 사용하여 requests.get("http://somesites.com/far.boo", stream=True, headers= head)을 사용하여 작업을 수행합니다.

나는 그것을 조금 추한 https://httpbin.org/headers

에서 광산을 발견

head = {"User-Agent": "Mozilla/5.0 ..."}

먼저 머리를 정의하지만 제대로 작동합니다.

참조 : download image from url using python urllib but receiving HTTP Error 403: Forbidden