2013-03-04 7 views
0

MS Word 문서를 WordML 형식으로 생성하는 Java 웹 응용 프로그램이 있습니다 (파일 확장자가 .xml 인 Word 2003 XML 형식의 단일 XML 파일). 문서를 .docx 파일 (본질적으로 여러 XML 파일이 포함 된 zip 파일)로 저장할 수 있도록이 파일을 최신 Office Open XML 형식으로 자동 변환하려고합니다.Java 웹 응용 프로그램에서 WordML을 Office Open XML로 변환하는 방법은 무엇입니까?

완전히 자동화되어야하며 사용자가 파일을 다운로드하여 수동으로 변환 할 필요가 없습니다. 또한 사용자는 MS Word가 설치되어 있다고 가정 할 수 없습니다 (대신 LibreOffice를 사용할 수도 있음).

나는 이것을 할 수있는 자바 라이브러리를 찾고 있었지만 .xml.docx으로 변환하는 것을 찾을 수 없었다. 내가 찾을 수있는 유일한 변환기는 JODconverter이지만 .xml에서 .docx으로의 변환은 지원되지 않습니다.

이러한 종류의 변환을 수행 할 수있는 Java 라이브러리가 있습니까? 아니면 자바가 아닌 솔루션을 찾고 있을까요? 아마 파이썬 모듈이 이것을 할 수 있을까요? (예를 들어 Python 스크립트는 Java 응용 프로그램에서 생성 된 파일을 가져 와서 .docx으로 변환 할 수 있습니다.)

+1

단일 XML 파일을 말할 때 Flat OPC XML 형식 또는 Word 2003 XML 형식을 의미합니까? – JasonPlutext

+0

@JasonPlutext Word 2003 XML 형식입니다. 이 질문을 명확하게하기 위해 편집했습니다. –

답변

1

플랫 OPC XML을 방출하도록 응용 프로그램을 수정할 수없는 경우 Word에서 변환 할 XSLT를 작성할 수 있습니다 2003 XML 형식을 Flat OPC XML로 변환합니다. 그것들은 꽤 비슷합니다.

그렇다면 docx4j (공개 : 저는 이것을 유지합니다)는 docx에 대한 플랫 OPC XML을 지원합니다.

+0

https://github.com/plutext/docx4j/commit/df9afd6fc6d4256a478b8e74d3f7f418c748ebaf는 Word 2003 XML을 docx 형식으로 변환하는 개념의 증명입니다. – JasonPlutext