2017-11-22 11 views
0

XML 파일을 읽는 데 StAX 파서를 사용하고 있습니다. 일부 XML 파일의 형식이 올바르지 않은 것은 일부 끝 태그가 누락되었을 수 있음을 의미합니다. 예 : <tag1> <tag2> </tag2> <tag3> <tag4> </tag4> </tag1> 이 경우 StAX 파서는 끝 태그가없는 경우 앞으로 이동하지 않습니다. 'tag3'까지만 읽습니다.끝 태그를 찾을 수 없을 때 StAX 파서가 앞으로 이동하지 않습니다.

이 문제를 해결하거나 파일 형식에 관계없이 전체 파일을 구문 분석 할 수있는 다른 구문 분석 방법을 제안하십시오.

+0

xml을 고쳐서 xml 파서에 넣기 전에 xml을 고쳐 쓰거나 구문 분석 절차를 직접 작성하십시오.이 문제를 해결하기위한 쉬운 방법은 없습니다 ... –

답변

1

입력이 "잘 형식화되지 않은 XML"이 아니며, XML이 아닙니다. STaX 나 DOM과 관계없이 XML 파서가 올바르게 작동하려면 유효한 XML을 제공해야합니다.

+0

이러한 파일을 읽을 수있는 프레임 워크가 있습니까? 내 주요 목표는 XML 파일 태그를 읽고 형식에 관계없이 콘텐츠를 가져 오는 것입니다. 태그를 검색하려면 내용을 읽어야합니다. – Rekha

+0

쓰레기 XML에서 좋은 XML을 만들려고하는 validator.nu 및 HTML Tidy와 같은 도구가 있습니다. 물론 더 나은 것은 처음부터 쓰레기 XML을 만드는 것을 피하는 것입니다. –

+0

XML 파일 만들기가 내 손안에 없습니다. 어떤 사람들은 파일을 만들고 그것들을 읽을 필요가 있습니다. 그래서 나는 그러한 도구를 찾고 있습니다. – Rekha