2013-04-29 3 views
0

WebHarvest를 사용하여 Woot.com에서 데이터를 수신하려고하는데 몇 가지 오류가 발생합니다. 첫 번째 프로세스에서 웹 사이트를 가져올 수 있지만 변수 창 내부에서 xpath를 테스트하려고하면 오류가 발생합니다. org.xml.sax.SAXParseException; lineNumber : 86; columnNumber : 99; 엔터티 "pt2"에 대한 참조는 ';'로 끝나야합니다. 구분 기호. 꽤 인쇄 기능을 사용하려고하면 XML 형식이 올바르지 않습니다. 엔터티 "pt2"에 대한 참조가 ';'로 끝나야합니다. 구분 기호. {line : 86, col : 99}. 마지막으로, xpath 태그에 표현식을 넣으면 스크립트를 작성하고 있습니다. 요소 유형 "xpath"뒤에 특성 지정 ">"또는 "/>"이 와야합니다. 누군가 내가 뭘 잘못하고 있다고 말할 수 있습니까? 나는 WebHarvest에 매우 익숙하며 이런 종류의 프로그램에 대한 경험이 없습니다.WebHarvest XML 형식이 잘못되었습니다.

내 코드는 다음과 같습니다

<?xml version="1.0" encoding="UTF-8"?><config> 
<xpath expression="(//div[@class="overview"])[1]//h2/text()"> 
<html-to-xml> 
<http url="http://www.woot.com/"/> 
</html-to-xml> 
</xpath> 
</config> 
+0

원하는 출력을 얻으려면 생성 한 구성 파일을 공유하십시오. 그리고 실제로 우리가 Woot.com URL –

답변

0

는 XML을 사용하면 속성 expression 내에서 사용 &apos; 대신 &quot;이 잘 형성하려면. 그리고 여기 간다 : 당신은 &apos; 또는 &quot;이 속성을 포장하는 데 사용할 수있는

<?xml version="1.0" encoding="UTF-8"?><config> 
<xpath expression="(//div[@class='overview'])[1]//h2/text()"> 
<html-to-xml> 
<http url="http://www.woot.com/"/> 
</html-to-xml> 
</xpath> 
</config> 

. 그러나 어쨌든 중첩 될 수는 없습니다. 이 도움이

<xpath expression='(//div[@class="overview"])[1]//h2/text()'>   --- valid 
<xpath expression='(//div[@class='overview'])[1]//h2/text()'>   --- invalid 
<xpath expression="(//div[@class="overview"])[1]//h2/text()">   --- invalid 
<xpath expression='(//div[@class=&apos;overview&apos;])[1]//h2/text()'> --- valid 
<xpath expression="(//div[@class=&apos;overview&apos;])[1]//h2/text()"> --- valid 
<xpath expression="(//div[@class=&quot;overview&quot;])[1]//h2/text()"> --- valid 

희망 : 다음은 몇 가지 예입니다.

+0

에서 얻고 싶은 것을 알려주십시오. 나는 그 사실을 더 빨리 알아 차렸을 것입니다. 당신의 도움에 감사드립니다! – user2330657