텍스트 및 이미지가있는 Java에서 Word .doc 파일을 읽어야합니다. 이미지 &을 인식하고 2 개의 파일로 분리해야합니다.Apache POI를 사용하여 Java에서 .DOC 파일을 읽고 텍스트와 이미지를 구분하는 방법은 무엇입니까?
"Apache POI"에 대해 최근에 들었습니다. Apache POI를 사용하여 Word .doc 파일을 읽는 방법
텍스트 및 이미지가있는 Java에서 Word .doc 파일을 읽어야합니다. 이미지 &을 인식하고 2 개의 파일로 분리해야합니다.Apache POI를 사용하여 Java에서 .DOC 파일을 읽고 텍스트와 이미지를 구분하는 방법은 무엇입니까?
"Apache POI"에 대해 최근에 들었습니다. Apache POI를 사용하여 Word .doc 파일을 읽는 방법
무료입니다 (또는 저렴합니다.) Aspose.Words은이를 수행 할 수 있어야합니다. 평가판 다운로드를 통해 작은 파일을 재생할 수 있습니다.
대상 파일도 문서 여야합니까? Office에서 문서를 열고 HTML로 저장할 수 있습니다. 그러면 분리는 사소 해집니다. RTF도 실행 가능한 옵션이지만, 필자의 머리 꼭대기에서 좋은 RTF 파서를 추천 할 수는 없다.
방금 다른 해결책을 생각해 냈습니다 : Jacob하지만 동일한 컴퓨터에서 실행되는 Office 인스턴스가 필요합니다. Java COM Bridge의 약자로 Office의 COM 라이브러리를 호출하여 문서를 조작 할 수 있습니다. 나는 그것이 소리가 날지도 모르는 것처럼 무섭지 않을 것이라고 확신한다!