2012-01-18 2 views
2

내가 HTMLDOC를 사용하여 PDF를 HTML로 변환하기 위해 노력하고있어,하지만, 심지어 기본적인 HTML 제대로 변환하지 않습니다와 함께 PDF로,이 HTML이 :나쁜 변환 HTMLDOC

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" 
    "http://www.w3.org/TR/html4/loose.dtd"> 
<html> 
<head> 
    <title>pdf test</title> 
</head> 

<body> 
    <table border="1"> 
     <tr> 
      <td width="50%"> 
       a 
      </td> 
      <td> 
       <p> 
        some address 
       </p> 
       <p> 
        some other text 
       </p> 
      </td> 
     </tr> 
     <tr> 
      <td> 
       test<br> 
       test2<br> 
       asdfasdf<br> 
       qwerqwer<br> 
       fasdfasdf 
      </td> 
      <td> 
       bla 
      </td> 
     </tr> 
    </table> 
</body> 

</html> 

을하지만 같은 렌더링 이 : test.pdf이 명령을 사용하여 :

htmldoc --webpage --color --charset utf-8 -t pdf14 --size a4 test.html -f test.pdf 

이, 내가 문자 집합을 변경 HTMLDOC Version 1.9svn 시도 것을 .. 당신은 문제가 될 수 있는지 알 수 있습니까 도왔 thead, tbody 등을 추가하지 아무것도?

htmldoc --size universal --webpage -t pdf --firstpage p1 -f test.pdf test.html 

이 잘 날 위해 페이지를 렌더링 :

또한이 점에서 style="padding: 10px"을지지 않습니다는 등

+0

범프. 같은 문제. 1.9는 끝나지 않았으며 1.8은 utf8을 지원하지 않습니다. 쉬운 해결책은 다른 pdf 라이브러리를 사용하는 것입니다. 불행히도, 내 의뢰인은 정부이고 그들은 이것을 사용하도록 강요하고 있습니다. 버전 1.8의 utf8 인코딩 또는 FF/IE에 표시되지 않는 1.9에 대한 수정이 필요했습니다. –

+1

도메인 pocebo.sk를 가리키는 test.pdf URL이 적어도 해결되지 않습니다. –

답변

1

명령 문단. 원래의 질문에서 입력 한 utf-8 색상 및 pdf 유형의 옵션이 결과에 실제로 필요한지 또는 실제로 잘못된 렌더링의 원인인지 여부가 명확하지 않습니다.