2011-01-12 3 views
2

확장자가 doc/docx/xls/xlsx/pdf 인 파일을 HTML 파일로 변환하고 싶습니다. Perl을 사용하여 Solaris에서 간단한 방법으로이를 수행 할 수있는 방법이 있습니까?perl doc/pdf/xls에서 HTML 변환기

답변

2

필자가 Microsoft Office 파일을 처리하는 데 사용한 perl 라이브러리가 거의 부족하여 아직 Office 2007 및 Office 2010 확장을 처리하는 데 도움이되는 파일을 찾지 못했습니다 (주석에서 하나를 가리 키십시오.) Microsoft Office를 실행하는 PC가 있으면 win32ole을 사용하여 유닉스에서 Office 응용 프로그램을 제어 할 수 있습니다. 나는 루비 전에 그것을 한 적이 : 당신이있는 것처럼 (두통을 많이 가지고 있기 때문에 http://metacpan.org/pod/Win32::OLE

나는 개인적으로 OLE 접근 방식을 권장하지 않습니다 : 여기에 http://rubyonwindows.blogspot.com/2007/03/automating-excel-with-ruby.html

이는 Win32 OLE를 사용하는 펄 모듈의 유닉스 스크립트가 작동하려면 PC에서 Office를 실행하고 Windows 방화벽은 PC가 패치로 업데이트되면 유닉스 스크립트를 거의 무작위로 차단합니다. > 당신이 exceltohtml

요구를 사용할 수 있습니다 - 엑셀 HTML로에 대한 http://www.codeproject.com/KB/java/PDFCM.aspx

1

사이드 노트로는 converts pdf files to text 인 xpdf라는 유틸리티가 있습니다. 솔라리스에서 컴파일되었지만 소스에서 컴파일해야합니다 (명령 줄에서 유틸리티를 호출 할 수 있습니다). 나는 그것을 사용했고 그것은 훌륭합니다.

더 중요한 것은입니다. 수정 된 버전은 converts pdf to html입니다. 이 중 하나는 테스트하지 않았지만 시도해 볼 가치가 있습니다.

1

가 :

내가 여기,하지만이 시도하지 않은 당신을 위해 일괄 변환을 수행하는 오픈 오피스와 고스트 스크립트를 사용하는 자바 프로그램의 다음 모듈 :

use Spreadsheet::ParseExcel; 
use File::Find ; use Cwd ;