0
이 <data>some 'text'</data>
과 같은 것이 있다고 가정 해 봅시다. expat는이 문제를 해석하는 데 문제가 없습니다.
이제 : <data>'<some text>'</data>
이 일치하지 않는 태그에 대해 괴롭 히면 <
이 발견됩니다.Expat이 '<' or '>'이 텍스트 섹션에있는 경우
불행히도 나는 더 이상 시작 태그가 없으므로 불행히도 <
과 >
을 모두 피할 수는 없으므로 not well-formed
이됩니다. 이 문제를 해결할 수있는 간단한 방법이 있습니까? 생각할 수있는 유일한 방법은 정규 표현식을 <
및 >
에서 인용문 내에있는 경우 이스케이프 처리하는 것입니다.
편집 : 파괴의 실제 부분이 :
<script type='text/javascript'>
(function() {
var useSSL = 'https:' == document.location.protocol;
var src = (useSSL ? 'https:' : 'http:') +
'//www.googletagservices.com/tag/js/gpt.js';
document.write('<scr' + 'ipt src="' + src + '"></scr' + 'ipt>');
})();
</script>
손상된 XML이 있습니다. 파서를 깨뜨리지 않고 xml을 수정해야합니다. ''은 무효 인 속성'data'을 가진'some' 싱글 톤 태그로 나타나기 때문에 유효하지 않습니다. –
XML을 변경하고 싶을만큼 많이 할 수 없습니다. 나는 웹 사이트에서 xhtml을 파싱 중이며 해킹 된'document.write ('