doc/docx 문서를 의미 론적 HTML로 변환하고 싶습니다.doc/docx를 의미 론적 HTML로 변환
일부 희망/요구 사항 문서 헤더 < > H1, H2 < > 등이다
시맨틱 HTML되도록는 테이블 < > 테이블 등이다.
표제, 목록, 표 및 이미지를 처리하는 것이 가능해야합니다. 그래프와 수학 수식은 아주 좋습니다.
• doc/docx에서 html로 직접 변환 할 필요가 없으며 xml 또는 docbook과 같은 중간 형식을 사용할 수 있습니다.
• 프로그래밍 방식으로 많은 수의 문서를 사용해야합니다.
내가 지금까지 발견 한 해결책에 가장 가까운 것은 http://holloway.co.nz/docvert/index.html이지만 불행히도 많은 버그, 작은 사용자 기반이 있으며 많은 문서를 처리 할 수 없습니다. 개념 증명의 더 많은 것.
업 캐스팅이 올바른 방향에 변환합니다. 나는 아직도 찾고있어, 그래서 더 많은 조언을 부탁드립니다. 그러나 누군가에게 "대답"을 수여하고 이것을 선택했습니다. – sandstrom