2011-03-29 3 views
1

가능한 중복 :
Export PDF pages to a series of images in Java오픈 소스 라이브러리

이미지 변환 PDF 파일에 사용할 수있는 좋은 자바 라이브러리를 제안하십시오. PDFBox를 사용하여 시도 : http://pdfbox.apache.org/ 이미지로 변환 한 후 PDF 파일의 텍스트 대부분이 이미지에서 깨졌습니다. 'T'는 'Y', 'C'는 '#'등으로 읽습니다.

PDDocument document = null; 
document = PDDocument.load(pdfFile); 
List pages = document.getDocumentCatalog().getAllPages(); 
for(int i=startPage-1; i<endPage && i<pages.size(); i++) 
{ 
    try 
    { 
    PDPage page = (PDPage)pages.get(i); 
    BufferedImage image = page.convertToImage(); 
    } 
} 
document.close(); 

나는 그들이 렌더링 글꼴이 몇 가지 문제 추측 : 다음

내가 같은 사용되는 코드입니다. PDFBox를 사용하면서 뭔가를 놓친 것 같아서 알려주세요.

다른 대안을 제안하십시오.

나는 jPedal : http://www.jpedal.org/을 사용해 보았지만 괜찮 았지만 자유롭지는 않았으므로 이것에 대한 모든 좋은 대안을 제안 해주십시오.

답변