2017-02-26 15 views
1

pdfkit하는합격 난 그냥 파이썬으로 웹 사이트를 다운로드

p =urllib2.build_opener(urllib2.HTTPCookieProcessor).open('http://www.google.com') 
html_content = p.read() 

그리고 지금은 pdf 파일에 기록 할 :

pdfkit.from_file(??????,'test.pdf') 

하지만 어떻게 내가 html_content을 통과 할 함수에서? 파일을 예상하지만 파일을 먼저 html로 저장하고 싶지 않습니다. pdfkit.from_file 함수에서 가져온 html_content를 전달하는 방법이 있습니까?

참고 : .from_url을 사용하지 않으려면 먼저 urllib2를 사용하여 페이지를 가져 오려고합니다.

답변

1

pdfkit.from_string 있습니다

.... 
html_content = p.read() 
pdfkit.from_string(html_content,'test.pdf') 

pdfkit.from_url :

pdfkit.from_url('http://www.google.com') 

그리고, 첫 번째 매개 변수로 pdfkit.from_file 읽기 파일 이름, 또한 파일 - 류의 객체를 받아; urllib....open의 리턴 값을 파일과 유사한 오브젝트로 전달할 수 있습니다.

pdfkit usage을 참조하십시오.

+0

하지만 from_string처럼 보이지만 html을 해석하지 않습니다 ... 단지 텍스트를 pdf로 쓰고 싶습니까? – Bosiwow

+0

파일로 p를 넘기는 것은 작동하지 않았습니다 (빈 PDF를 만들었습니다) 그러나 from_string은 실제로 문자열을 해석하고 좋은 pdf 파일을 만들었습니다! 고맙습니다! – Bosiwow