2012-02-22 3 views
0

여러 페이지를 구문 분석해야하는 웹 사이트의 북마크릿을 만들고 있습니다. DOMParser을 시도했지만 xml 옵션에 오류가 발생하고 html로 null을 반환합니다. 나는 jQuery를 시도했지만 DOMParser를 어딘가에 사용하고 있다고 확신한다. 그것은 PHP에서 올바르게 작동하지만 웹 페이지에 두 배 많은 요청을하지 않아도됩니다.자바 스크립트에서 잘못 작성된 HTML을 구문 분석 하시겠습니까?

xml 또는 html을 구문 분석 할 독립 실행 형 javascript 플러그인을 찾고 있습니다.

감사합니다.

+1

참조 - http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – ChrisF

+0

DOMParser를 사용하기위한 코드를 게시 할 수 있습니까? – pyramation

+1

@ChrisF, 나는 파서 인 Regex를 찾고 있지 않다. PHP 나 Javascript의 내장 파서 (parser)에서 배후에서 일어나는 일을 조금도 단정 짓지 못했지만 정규식이 없으면 불가능하다는 말을하고 있습니까? – mowwwalker

답변

1

DOM을 사용하여 HTML을 "구문 분석"할 수만 있습니까? 당신은 다른 페이지에서 외부 파일을로드하지 않도록하려면 :

당신은 iframe에 다른 페이지를로드하고이 document.frame[0].contentWindow.document

EDIT 같은 DOM에 액세스, 동일한 전류 페이지에서 여러 페이지를 수행해야하는 경우 스크립트를 실행 한 다음 Ajax (XMLHttpRequest)를 사용하여 각 페이지를 가져옵니다. 각 페이지에 대해 var newdiv = document.createElement('script'); newdiv.innerHTML = ajaxcontent;과 같은 코드를 사용하고 DOM을 사용하여 newdiv에서 내용을 읽습니다. 페이지에 newdiv를 추가하지 않으면 DOMParser를 사용하는 것처럼 가볍습니다.

+0

아니요, 여러 페이지에 대해 수행해야하며 리소스가 많이 소모 될 수 있습니다. – mowwwalker

+0

제안 된 솔루션이 솔루션보다 적합하지 않다는 점을 자세히 설명해 주시겠습니까? 제안 된 솔루션을 통해 볼 수있는 유일한 단점은 다른 페이지를로드하면 스크립트에서 외부 파일을로드한다는 것입니다. 이 경우, "EDIT"후에 나의 업데이트 된 답변을보십시오. –

+0

... 콘텐츠를 DOM에로드하면 모든 그림, 모든 미디어 등을로드하는 것입니다. – mowwwalker