, 그래서 매우 낮은 수준에서 시작합니다 : 그런 다음 XHTML 출력 루프는 같은 것을 할 수 있습니다. 파이썬에서 파일을 매우 간단하게 반복 할 수 있습니다.
fyle = open("contents.txt")
for lyne in fyle :
# Do string processing here
fyle.close()
이제 구문 분석 방법을 설명합니다. 각 형식 지정 문 (예 : p, h1)이 별도의 줄에 있으면 쉽게 확인할 수 있습니다. 나는 핸들러의 사전을 구축하고 얻을 핸들러를 너무 싶습니다
handlers= {"p": # p tag handler
"h1": # h1 tag handler
}
# ... in the loop
if lyne.rstrip() in handlers : # strip to remove trailing whitespace
# close current handler?
# start new handler?
else :
# pass string to current handler
당신은 무엇을 Daniel Pryden suggested을 할 수 먼저 메모리 내 데이터 구조를 만든 다음 XHTML 것을 직렬화. 이 경우 처리기는 각 태그에 해당하는 객체를 작성하는 방법을 알고 있습니다. 그러나 나는 더 간단한 해결책, 특히 많은 시간이 없다면 XHTML로 곧장 가서 현재 묶인 태그의 스택을 유지하는 것만으로도 충분하다고 생각한다. 이 경우 "핸들러"는 출력 파일/문자열에 태그를 쓰는 간단한 논리 일 수 있습니다.
문제의 세부 사항을 모른 채 더 이상 말할 수 없습니다. 게다가, 나는 너를 위해 모든 숙제를하고 싶지 않아. 이것은 당신에게 좋은 시작을 제공해야합니다.
입력 파일의 형식이 다소 모호합니다. 이것은 SO에서 표시되는 방식 일 수 있지만 ...이 "p", "h1"표시는 별도의 줄에 있거나, 적용되는 섹션 바로 앞에 있거나 HTML과 유사한 태그 여기에 괄호와 닫는 태그가 없어 졌거나 생략 되었습니까? – mjv