2mil 라인 XML 파일의 시작과 끝 부분에 루트 태그를 추가하여 파이썬 코드로 파일을 올바르게 처리 할 수 있습니다. <root> 태그를 Python을 사용하여 XML 문서에 추가
은 내가 previous post에서이 코드를 사용하여 시도,하지만 난 오류 "XMLSyntaxError를 : 추가 내용을 문서, 라인 __의 끝에서, 1 열"는 무엇입니까 나는이 문제를 어떻게 해결합니까를? 아니면 내 큰 XML 문서의 처음과 끝에 루트 태그를 추가하는 더 좋은 방법이 있습니까?
import lxml.etree as ET
tree = ET.parse('test.xml')
root = tree.getroot()
newroot = ET.Element("root")
newroot.insert(0, root)
print(ET.tostring(newroot, pretty_print=True))
내 테스트 XML은
<pub>
<ID>75</ID>
<title>Use of Lexicon Density in Evaluating Word Recognizers</title>
<year>2000</year>
<booktitle>Multiple Classifier Systems</booktitle>
<pages>310-319</pages>
<authors>
<author>Petr Slavík</author>
<author>Venu Govindaraju</author>
</authors>
</pub>
<pub>
<ID>120</ID>
<title>Virtual endoscopy with force feedback - a new system for neurosurgical training</title>
<year>2003</year>
<booktitle>CARS</booktitle>
<pages>782-787</pages>
<authors>
<author>Christos Trantakis</author>
<author>Friedrich Bootz</author>
<author>Gero Strauß</author>
<author>Edgar Nowatius</author>
<author>Dirk Lindner</author>
<author>Hüseyin Kemâl Çakmak</author>
<author>Heiko Maaß</author>
<author>Uwe G. Kühnapfel</author>
<author>Jürgen Meixensberger</author>
</authors>
</pub>
test.xml 문서에는 루트 요소가 없으므로 XML이 아니며 파싱 할 수 없습니다. – mzjn
@mzjn 포인트를 놓친 경우 루트 태그를 추가하려고 시도하여 XML로 읽을 수 있습니다. – douglasrcjames
글쎄요, 요점은 루트 요소를 추가하기 전에 test.xml을 XML로 구문 분석하려고했기 때문입니다. 그래서 당신은 오류가 발생했습니다. – mzjn