PDF 문서를 Java의 단일 HTML 파일로 변환하려고합니다. 대부분의 변환기는 하나의 PDF 파일을 여러 개의 HTML 파일로 변환합니다. 전체 PDF를 하나의 HTML 파일로 변환하려고합니다.PDF 파일을 단일 HTML 파일로 변환
제안 사항?
PDF 문서를 Java의 단일 HTML 파일로 변환하려고합니다. 대부분의 변환기는 하나의 PDF 파일을 여러 개의 HTML 파일로 변환합니다. 전체 PDF를 하나의 HTML 파일로 변환하려고합니다.PDF 파일을 단일 HTML 파일로 변환
제안 사항?
itext으로 PDF 문서를 구문 분석 한 다음 HTML 파일을 생성 할 수 있어야한다고 생각합니다. 내가 할 수 있는지 확인하지 않았 음을 인정해야합니다.
의견이 있으십니까?
당신은 항상 여러 HTML 파일의 각각의 body
을 통합하는 하나의 문서를 작성하는 JSoup API를 사용하여 몇 가지 코드를 작성할 수 있습니다. 스타일을 결합하면 스타일 시트 (CSS)가 좀 더 까다로울 수 있습니다 (특히 원본 HTML이 'id'요소를 사용하는 경우).
는하지만 나는 열심히 하지 거기 컨버터가있는 '하나의 문서'에 옵션이 믿고 찾을 수 있습니다. 나는 더 이상 검색하는 것이 좋습니다.
당신은 하나의 파일에 쓸 수있는 옵션이있는 http://www.jpedal.org/html_index.php을 보았습니까?
텍스트 만 추출하거나 서식을 지정하려고합니까? –