2010-12-03 4 views
0

치킨 풋을 사용하여 웹 크롤러를 작성 중이므로 PDF 파일을 저장해야합니다. 나는 페이지의 링크를 클릭하거나 PDF의 URL을 잡고치킨 풋으로 PDF 파일 저장

go("http://www.whatever.com/file.pdf") 

를 사용하고 난 파이어 폭스 얻을 대화 상자 "file.pdf 열기"를, 실제로 저장하려면 "OK"버튼을 클릭 할 수 없습니다 수 있습니다 파일.

다른 방법으로 파일 (wget, python의 urllib2, 능 직물)을 다운로드하려고 시도했지만 PDF 파일은 게이트로 작동하지 않으므로 그 중 아무 것도 작동하지 않습니다.

도움을 주시면 감사하겠습니다.

답변

0

보안을 위해 Firefox 대화 상자를 클릭 할 수 없습니다. URL 내용을 다운로드하는 가장 좋은 방법은 URL 내용을 읽고 쓰는 것입니다.

// Chickenfoot 1.0.7 Javascript Code to download the content of a url. 
include("fileio.js"); // enables the write function. 
var url = "http://google.com", 
    saveFileTo = "c://chickenfoot-google.com"; 

write(saveFileTo, read(url)); 

chickenfoot와 jquery를 사용하면 도움이 될 수 있습니다. http://groups.csail.mit.edu/uid/chickenfoot/scripts/index.php?title=Using_jQuery,_jQuery_UI_and_similar_libraries

+0

Larry, 웹 페이지의 소스를 저장하는 데는 문제가 없지만 PDF 파일이나 내가 시도한 다른 이진 파일이 손상된 것으로 보입니다.jQuery에 대해 조금 읽었지만이 문제에 대한 해결책을 찾지 못했습니다. – alaiacano

0

Mozilla 개발자 문서에서 대상을 저장하는 방법에 대한이 예제는 원하는대로 정확하게 수행해야합니다. 임시 환경 변수를 얻는 것과 매우 유사한 Chickenfoot 예제를 테스트했습니다. Chickenfoot에서 잘 작동합니다.

https://developer.mozilla.org/en/XPCOM_Interface_Reference/nsIWebBrowserPersist#Example

당신은 액션이 파일을 저장하도록 설정되어 있는지 확인하기 위해 도구, 옵션, 응용 프로그램에서 응용 프로그램 협회와 함께 플레이 할 수 있지만 이러한 설정은이 기능이 적용되지 않을 수도 있습니다.

최종 답변, 관련 grumblings을 시작 ...

나는 확실히 누군가가 치 켄풋에있는 많은 버그를 수정하고, 좋은 요리 책 프로그래밍 가이드를 작성합니다 바랍니다. 나는 수년간 그것을 사용 해왔고, 아직도 할 수있는 많은 기본적인 것들이 있습니다. 나는 마침내 부서지고 메일 링리스트에 가입했다. 아카이브에는 괜찮은 스크립트 예제가 있기 때문이다. 웹 API 참조가 매우 드문 경우 pdf 참조, 블로그 등을 통해 많은 검색이 필요합니다. Chickenfoot가 얼마나 간단한 작업을 자동화 할 수 있는지 간단하게 생각합니다. 그러나 웹 프로그래머가 아니기 때문에 javascript, DOM 및 Firefox 문서를 검색하는 데 며칠이 걸리지 않습니다. 치킨 풋 (Chickenfoot)의 목표는 될 필요가없는 것 같지만 불행히도 MIT가 프로젝트를 중단 한 것처럼 개념 증명을 정제하는 사람은 거의 없습니다.

Chickenfoot 명령 만 사용하여 여러 가지 방법을 시도했지만 최신 Firefox 3 및 Chickenfoot 1.0.7에서는 작동하지 않습니다.

도움이 되었기를 바랍니다. 행운을 빕니다. 죄송 합니다만 어제 귀하의 질문에 만났지만 너무 혼자 떠나기에 흥미가있었습니다.