2017-09-03 16 views
0

공유 드라이브에서 SharePoint로 (예 : SharePoint Online) MS Office 파일 세트를 마이그레이션한다고 가정합니다. Office 2007 이후로 제한되어 있으므로 DOCX, XLSX와 같은 파일 확장명이 필요합니다.SharePoint는 메타 데이터가 추가 된 이후 처음 저장할 때 MS Office 파일의 크기를 변경합니다. 콘텐츠가 변경되지 않았 음을 확인할 수 있습니까?

특정 메타 데이터가 추가되면 파일 크기가 SharePoint에 저장 될 때 변경된다는 것을 알 수 있습니다. (PDF 또는 JPEG와 같은 비 MS Office 파일의 파일 크기는 변경되지 않지만).

이러한 MS Office 파일은 여러 구성 요소가 배치 된 "컨테이너"입니다. 이러한 상황은 XLSX 파일의 확장명을 ZIP으로 변경하고 WinZip으로 열어서 크게 볼 수 있습니다.

좋은 사운드 무결성을 위해 "파일 콘텐츠"구성 요소 부분이 변경되지 않았 음을 확인하고 싶습니다.

콘텐츠를 나타내는 컨테이너 내의 구성 요소를 어떻게 식별 할 수 있습니까? 설명한대로 SharePoint에 저장하면 이러한 구성 요소 부분이 변하지 않습니까?

그렇다면 한 쌍의 파일을 분석하여 내용이 동일하거나 변경되었는지 확인할 수있는 유틸리티가 있습니까? 두 파일에서 생성 할 수있는 체크섬이 있는지 비교해보십시오.

그런 유틸리티가 없다면 어떤 종류의 환경을 만들면 가장 좋을까요? - VB.NET 및/또는 C#에서 실행할 수 있습니까?

감사합니다.

이 이전 게시물은 같은 문제와 관련이 있지만 필요한 답변을 제공하지 않습니다. C# - Hash contents of MS Office documents without metadata

답변

0

흥미로운 주제. 콘텐츠를 나타내는 컨테이너 내의 구성 요소 부분을 어떻게 식별 할 수 있습니까? 당신은 콘텐츠 파일의 각을 평가해야하는 DOCX 내

. docx 내의 파일은 압축을 사용하여 압축됩니다. 그래서 당신은 아마 그들을 팽창시켜야 할 것입니다. 이것은 document.xml 및 document.xml.rels 파일뿐 아니라 - 헤더 xml 파일 (1 이상일 수도 있음) - 헤더 .rels 파일 - 바닥 글 xml 파일 (여러 파일 여러 개) - 바닥 글 .rels 파일) - 미디어 파일 (포함 이미지)

는 당신은 셰어 속성 강등 제목 같은 필드를 변경하는 경우 core.xml 파일을 확인해야합니다.

요약하면 docx 수준에서 docx 파일을 비교할 수 없습니다. 압축을 풀고 "content"파일 각각을 비교해야합니다 (예 : CRC32 또는 MD5 사용).

이 기능을 제공하는 유틸리티에 대해 알지 못합니다.

참고 : 파일을 보관 용으로 SharePoint에 업로드하기 만하면 파일을 별도의 zip 파일로 저장하면됩니다.이것은 단지 콘텐츠를 저장하고 사용자가 변경을 요구하지 않는 경우에만 옵션입니다.