2012-12-28 7 views
0

여러 클래스의 XML 객체 (예 : 문서 이미지 유형)가 주어지면 객체의 클래스 및 XML 파일의 내용과 관련된 복잡한 수학 규칙 집합에 따라 몇 가지 출력을 생성해야합니다.파이썬에서 파싱 규칙을 인코딩하는 방법은 무엇입니까?

이 작업의 일반 이름 (구문 분석)은 무엇이며 규칙이 수학적 관계를 포함 할 수 있다는 것을 염두에두고 각 클래스에 대해 별도의 규칙을 인코딩하는 가장 쉬운 방법은 무엇입니까? DSL을 사용하여 관리하기 쉽도록 각 클래스에 대한 파일을 만들어야한다고 생각하지만 확실하지 않습니다. 누가 루아 또는 자바 스크립트 인터프리터를 통합 할 것을 제안했습니다. 이것은 좋은 생각입니까? 나는 그것을 가늘고 단순하게 유지하고 싶다.

답변

2

구문 분석은 일련의 토큰을 읽고 문법에 일치하는 규칙을 참조합니다. 이런 식으로 문제를 지정할 수 있으면 pyparsing을 사용하여 문법을 작성할 수 있습니다.

XML 문서의 구조를 추출하는 것이 흥미로운 경우 표준 파이썬 모듈 xml.etree.ElementTree를 사용할 수 있습니다. 또한 beautifulsoup 봐.

+0

감사합니다. 귀하의 제안으로 인해 문법의 적합성을 조사하게되었습니다. – Emre