2012-04-24 2 views
3

URL에서 전달할 수있는 최상의 Java 라이브러리를 찾고 웹 페이지의 모습을 이미지로 만듭니다. 브라우저. 나는 거의 모든 웹 페이지가 깨지기 때문에 flyingsaucer을 시험해 보았습니다. www.google.com 또는 yahoo.com을 렌더링하지도 않았습니다. 렌더링 할 수있는 유일한 사이트는 www.w3c.org입니다!프로그래밍 방식으로 HTML 페이지를 이미지/PDF로 변환하기위한 최상의 Java lib

더 나은 도구를 사용하거나 비행 접시를 xhtml에서 좀 더 느슨하게 생각하는 것은 받아 들일 수 있습니까?

사용 URL을 자바 라이브러리 :

답변

5

Flying Saucer는 xhtml 만 허용하므로 많은 페이지에서 실패합니다 (매뉴얼 참조).

하지만 일부 html 라이브러리를 사용하여 입력을 "정리"한 다음 FS를 사용할 수 있습니다.

Webesite -> "클리너"-> 비행 접시

좋은 무료 libs와는 다음과 같습니다

  1. JSoup (개인 추천)
  2. HtmlCleaner
  3. JTidy (때로는 더 엄격 필요 이상으로)
  4. Jericho HTML
0

에서 iText.jar를에게

다운로드를 시도 할 수 있습니다. 이것에 대한 많은 예제가 있습니다. PDF 변환하는 방법에 대한

: 당신은 스프링 프레임 워크를 사용하는 경우

, 당신은이 iText API를 통해 AbstractPdfView 클래스를 사용할 수 있습니다. this 내가 가장 좋아하는 예입니다. 나는 당신이 그것을 쉽게 이용할 수 있다고 생각합니다. 변환 된 이미지에 대한

: http://code.google.com/p/java-html2image/

총 : URL → 의한

읽기 HTML iText를 또는 자바 html2image를 통해 변환

나는이 하나가 좋습니다. 특정 라이브러리에 두지 말고 직접 해보는 것이 좋습니다.