0
MSXML의 DOMDocument에 HTML 덩어리를로드하려고합니다. 이 청크는 유효한 XML이며 하나만 제외하면
엔티티가 있습니다. 그들에 대한 MSXML 질식, "정의되지 않은 엔터티 'nbsp'에 대한 참조."MSXML에서 nbsp와 함께 HTML 청크를 구문 분석합니다.
MSXML을 유효한 것으로 인식하도록 만들 수 있습니까?
MSXML의 DOMDocument에 HTML 덩어리를로드하려고합니다. 이 청크는 유효한 XML이며 하나만 제외하면
엔티티가 있습니다. 그들에 대한 MSXML 질식, "정의되지 않은 엔터티 'nbsp'에 대한 참조."MSXML에서 nbsp와 함께 HTML 청크를 구문 분석합니다.
MSXML을 유효한 것으로 인식하도록 만들 수 있습니까?
간단한 해결책 : "& nbsp;"텍스트 대체를 실행하십시오. 문서를 파싱하기 전에 ""에 추가하십시오. 축음계가 없기 때문에 어느 쪽이 좋을까요 & nbsp; 교체해서는 안되는 텍스트에
기타 표준 솔루션 : nbsp; 엔티티를 xml 루트 노드 앞에 넣으십시오.
<!DOCTYPE foobar [
<!ENTITY nbsp " " >
]>
"0xA0"및 & # x00A0을 사용할 수도 있습니다. 실제로 정상적인 공간 대신 비 분리 공간이 필요한 경우
첫 번째 옵션으로 종료되었습니다. 오 잘. 나는 그것들을 수정하지 않고 파일들을로드하는 것이 가능할 것으로 기대하고 있었다. –