2012-05-29 4 views
1

누군가 Ms Word 2003 및 2007의 xml 구조에서 차이점을 설명 할 수 있습니까? 건배! 당신이 찾고있는 설명의 종류를 알고 어렵다 있도록 :Ms Word 2003 및 2007 xml 차이점

답변

3

이 매우 광범위한 질문이지만, 주요 포인트는 틀림없이 있습니다

을 수행합니다. Word 2003 XML 파일은 압축되지 않은 단일 텍스트 파일에 저장되는 진정한 비 압축 XML 형식 파일입니다. Word 2007은 해당 형식으로 저장할 수 있지만 기본 형식은 .zip 파일에 저장된 XML 및 기타 파일 (예 : 이미지 파일)의 묶음입니다. 주 문서 본문, 머리글/바닥 글, 각주, 스타일, 문서 속성 등에 대한 별도의 XML 파일이 있습니다. 그러나 Word 2007은 "Flat OPC"라고도하는 압축되지 않은 단일 XML 파일 형식으로 저장할 수도 있습니다.

b. 말씀 2003 형식으로 사용되는 주 네임 스페이스 URI는 URI 주 문서에 대한 말씀 2007 형식에 사용되는 주 네임 스페이스가 http://schemas.openxmlformats.org/wordprocessingml/2006/main

다른 여러 네임 스페이스 URI를 사용하는 것입니다 http://schemas.microsoft.com/office/word/2003/wordml

이지만, 말씀의 경우 2007 년에는 ZIP에 포함 된 XML 문서의 각 유형에 대해 다른 기본 네임 스페이스를 사용하기를 원합니다.

c. Word 2003 형식은 Microsoft 외부에서 표준화 된 AFAIK 형식이 아닙니다. Word 2007 형식은 ECMA-376 및 ISO 29500이라는 두 가지 표준의 기초입니다. 2007 년 AFAICR은 ECMA-376을 준수하거나 거의 준수합니다. .zip 압축 형식 만이 표준입니다. Flat OPC 형식은 아니며 AFAIK에서 사용하는 추가 XML 네임 스페이스는 공식적으로 문서화 된 적이 없습니다 (이해하기 어렵지 않습니다).

OOXML 형식은 Word 문서를 여러 개의 별도 XML 문서와 다른 구성 요소 ("파트"라고도 함)로 분할하므로 형식은 관계 파일을 사용합니다.이 파일에는 한 부분 그리고 또 다른. 예를 들어 주 문서에 그림이 포함되어있는 경우 주 문서의 XML은 이미지 파일 부분을 참조해야하지만 일반적으로 파트의 이름을 직접 지정하는 대신 관계 ID를 사용하여이를 수행합니다.

+0

https://github.com/plutext/docx4j/commit/df9afd6fc6d4256a478b8e74d3f7f418c748ebaf는 Word 2003 XML에서 ECMA 376 docx 파일로 변환하는 개념의 증거입니다. 그것은 공정한 조금 밖으로 나가지만, 당신에게 글꼴, 번호 매기기 및 스타일을 변환하는 데 필요한 무슨 감각을 줄 것이다. – JasonPlutext