2010-02-16 9 views
8

docx 파일에서 단어 (스타일 포함)를 어떻게 읽을 수 있습니까? 두 개의 docx 파일을 한 단어 씩 비교하고 다른 docx 파일에 작성해야하는 차이점을 기반으로 (C# 및 OOXML 사용). 나는 (ICSharpCode.SharpZipLib가하는 ICSharpCode.SharpZipLib.dll DocumentFormat.OpenXml.Extensions.dll, OpenXMLdiff.dll을 사용하지만 아무것도 나에게 단어 별을 읽을 수있는 옵션을 제공하지 않습니다하여이를 달성 시도 한 단어 씩 말하지만 그 단어와 연관된 스타일은주지 않습니다).OOXML을 사용하여 Docx 파일 비교

이 문제에 대한 도움은 매우 유용합니다.

답변

0

가장 쉬운 방법은 즐겨 사용하는 ZIP 라이브러리를 사용하여 DOCX 파일의 압축을 풀고 텍스트 파일을 파일 IO 라이브러리와 비교하는 것입니다.

3

이 MSDN 기사에서는 단락별로 단락의 정확한 텍스트를 안정적으로 검색하는 방법을 보여줍니다. 동시에

http://msdn.microsoft.com/en-us/library/ff686712.aspx

, 각 단락의 스타일을 확인할 수 있습니다. 그건 아주 쉽습니다. 다음 블로그 게시물은 각 단락의 스타일과 텍스트를 검색하는 방법을 보여줍니다

http://blogs.msdn.com/b/ericwhite/archive/2009/02/16/finding-paragraphs-by-style-name-or-content-in-an-open-xml-word-processing-document.aspx

이 두 가지를 비교? 그것은 당신이 원하는 원하는 의미론에 달려 있습니다. 한 가지 방법은 단락과 스타일을 포함하는 XML 문서를 작성한 다음 XML 문서를 비교하는 것입니다. XML 문서는 다음과 같이 보일 수 있습니다.

<Root> 
    <Para> 
    <Style>Normal</Style> 
    <Text>This is the text of the paragraph.</Text> 
    </Para> 
    <Para> 
    <Style>Heading1</Style> 
    <Text>Overview of the Process</Text> 
    </Para> 
</Root>