2010-02-25 6 views
2

끝에 XMP XML 형식의 메타 데이터가 첨부 된 PDF가 있습니다. 이 메타 데이터를 구문 분석하고 사용하는 올바른 방법은 무엇입니까?PDF 파일의 끝에 첨부 된 XMP XML 메타 데이터를 구문 분석하는 올바른 방법은 무엇입니까?

나는 C99를 사용하는 작업 솔루션을 가지고 있습니다. 파일의 각 문자를 파싱하고 처음부터 시작하여 다음에 도달 할 때까지 루프를 사용하고 나서 닫는 태그에 도달 할 때까지 내용을 기록합니다. 이 일을하는 최선의 방법으로 볼 수 없습니다.

이제는 C# + Mono (.NET이 아닙니다)을 사용하여이 프로그램을 다시 작성하고 C99 버전을 모방하는 대신이 작업을위한 마법 프레임 워크 클래스가 있는지 궁금합니다. (또한 p/invoke 등이 포함되어 있지 않은 경우 제 3 자 라이브러리에만 의존 할 수 있습니다.)

이 앱은 크로스 플랫폼이어야하므로 Mono을 사용하고 있습니다.

답변

0

Adobe는 XMP specification을 게시했습니다. 시도 해봐. XML이 사용하는 XMP 스키마를 찾아서 그에 따라 파싱해야합니다.

-1

전체 XML을 문자열로 가져올 수있는 경우 XmlDocument.Load을 사용하여 쿼리 용 메모리에 전체 XML을 얻을 수 있습니다.

그런 다음 데이터를 얻으려면 XmlDocument.SelectNodes 메서드가있는 XPath를 사용할 수 있습니다.