2014-10-13 7 views
-2

PHP를 사용하여 웹 페이지의 로컬 복사본을 만들고 싶습니다. 이것은 mht와 같은 웹 아카이브이거나 이미지와 CSS가있는 html 일 수 있습니다. 당신은 내가이 작업을 수행하는 등의 라이브러리를 발견웹 아카이브 (이미지, CSS 등)를 완전히 웹 페이지에 저장하십시오.

브라우저 : "Save as"버튼을 누를 때 결과는 거의 동일해야합니다 : 마지막으로 하나 개의 큰 HTML 파일을 생성하지만, 아주 - 아주 느린 작동 http://freecode.com/projects/php-save-complete-html-page 정말 거대한 파일을 만듭니다.

나는 그물에 같은 해결책을 찾았지만, 그것은 또한 작동하지 않습니다

wget --no-parent --timestamping --convert-links --page-requisites --no-directories --no-host-directories -erobots=off http://cnn.com 

그것은 어떤 이미지를 만들지 않습니다, CSS를 다운로드하지 않습니다, 단지 HTML을 다운로드 만

내가 싶습니다 웹 페이지를 완전히 복사하거나 외부 도구를 찾을 수있는 PHP 라이브러리를 찾으십시오. API cal을 수행하고 MHT 아카이브를 얻을 수있는 방법을 찾으십시오.

+0

좋아, 이제 우리가 가까이와. 그래서 무엇을 알고 싶습니까? 귀하의 문제는 귀하의 문제를 분명히 알고 있기 때문에 무엇입니까? – arkascha

+0

웹 페이지를 완전히 복사하거나 외부 도구를 찾고 API cal을 수행하고 MHT 보관 파일을 얻을 수있는 PHP 라이브러리를 찾고 싶습니다. – freento

답변

0

독자적으로 작성하는 것이 좋다고 생각합니다. 컬링하고 외부 URL을 검색 한 다음 재귀 적으로이를 따르십시오. 밖에 도서관이있을 수 있습니다.

그렇지 않으면 PHP에서 exec()을 사용하여 명령 줄 프로그램을 실행할 수 있습니다. 사용하려는 경우

exec('httrack "http://www.all.net/" -O "/tmp/www.all.net" "+*.all.net/*" -v');

또한, wget, I found a set of options that should work가 (추정 내가 시도하지 않은 것처럼 예를 들어, http://www.httrack.com/html/fcguide.html

그래서 : HTTrack는 achiving 웹 사이트에서 좋은 일을 그것) :

wget \ 
    --recursive \ 
    --no-clobber \ 
    --page-requisites \ 
    --html-extension \ 
    --convert-links \ 
    --restrict-file-names=windows \ 
    --domains example.com \ 
    --no-parent \ 
     www.example.com/directoryToArchive