2009-10-16 2 views
0

.doc에서 하이퍼 링크를 추출 할 수있는 방법이 있습니까? 내 데이터베이스에서 가져올 필요가있는 문서의 하이퍼 링크가 많습니다..doc에서 하이퍼 링크 추출

doc을 HTML로 변환하려고 시도했지만 하이퍼 링크가 전송되지 않았습니다.

Regardz는 믈라덴

답변

0

다음 작업을 수행했습니다. officeXP로 .doc 파일을 연 다음 블로그로 게시 한 다음 해당 블로그를 필터링 된 웹 페이지 형태로 저장했습니다. 그렇게하면 쉽게 구문 분석 할 수있는 멋진 HTML을 얻을 수 있습니다.

2

우리는 비슷한 문제를 가지고 있었고, Aspose.Words라는 타사 구성 요소를 사용하여 끝났다. 여기에서 찾을 수 있습니다 : http://www.aspose.com

.NET 및 Java에서 사용할 수 있습니다.

+0

와우, 나는 이것이 새로운 것 같아. 몇 년 전에 필자는 Microsoft Office를 설치할 필요가없는 이와 같은 솔루션을 검색 및 검색했습니다. 하지만 Office Automation을 사용해야하는 항목을 찾을 수 없었습니다. 나는 약간 비싸다고 생각하지만, 나는 이와 같은 구성 요소를 선호한다. –

+1

Aspose.Words를 보증 할 수 있습니다. 수백 시간의 개발 시간을 절약 할 수 있었고 단순한 메일 병합으로 수행 할 수있는 것 이상의 Word 문서를 동적으로 만들 수있었습니다. 또한 색인 생성을 위해 Word 문서에서 모든 텍스트를 제거하는 데 사용합니다. MS 워드 문서를 많이 사용해야한다면이 제품을 적극 권장합니다. 또한 보너스 인 RTF도 처리합니다. –

0

파일을 OpenOffice로 가져 와서 하이퍼 링크가 전송되는지 확인할 수 있습니다. OpenDocument는 내부에 XML이있는 ZIP 파일이며, 일단 구문 분석을하면 매우 쉽게 파싱 할 수 있습니다.

0

처음 질문이 있은 지 몇 달 후에 알 수 있습니다. 그러나 Word Automation을 통해 .doc 파일의 하이퍼 링크를 추출 할 수도 있습니다. API에는 쉽게 추출 할 수있는 하이퍼 링크 개체가 있습니다.