webharvest

    0

    1답변

    WebHarvest를 사용하여 Woot.com에서 데이터를 수신하려고하는데 몇 가지 오류가 발생합니다. 첫 번째 프로세스에서 웹 사이트를 가져올 수 있지만 변수 창 내부에서 xpath를 테스트하려고하면 오류가 발생합니다. org.xml.sax.SAXParseException; lineNumber : 86; columnNumber : 99; 엔터티 "pt2"

    0

    1답변

    내가 앵커 후 약간의 공간이있는 페이지 긁어하기 위해 노력하고있어 제거 : </a>  |   내가 텍스트를 지정하는 방법을 찾을 수 없습니다를, 그리고 하나 프로세서 오류가 발생하거나 문자열 자체를 감지하지 못했습니다. 문자가 포함될 때 xml 형식이 올바르지 않기 때문에 HTML/XML 변환이 실패한 후에 모두 발생

    2

    2답변

    웹 수확을 사용하고 있습니다. 그러나, 나는이 URL에서 데이터를 스크랩 할 : http://derstandard.at/anzeiger/immoweb/Suchergebnis.aspx?Regionen=9&Bezirke=&Arten=&AngebotTyp=×tamp=1363305908912 내 코드는 다음과 같습니다 <?xml version="1.0"

    0

    1답변

    나는 최근에 Web-Harvest를 웹 스크래핑 도구로 사용하기 시작했습니다. 현재 웹 사이트에 대한 인증/로그인을 원하는 프로젝트를 시작할 때 일하고 있습니다. 먼저 코드의 [URL]이 웹 페이지의 실제 URL을 대체한다는 점을 분명히 밝힙니다. 그래서, 나는 다음과 같은 설정을 실행하여 로그인 정보를 게시하려고 : 나는 결과 정보를 검색하고 다시 방향을

    1

    1답변

    웹 수확 api를 사용하는 모바일 앱을 제작하여 웹 사이트에서 데이터를 추출하고 파일에 저장합니다. 그런 다음 앱은 데이터를 조작하여 표시합니다. 내 문제는 Java 용 webharvest를 사용할 때 config 파일과 출력 파일의 경로가 "C : /config.xml"및 "C :/docs"와 같은 로컬 디스크와 관련이 있지만 Android 프로젝트에서

    2

    2답변

    웹 페이지의 내용을 읽는 데 도움이 필요합니다. 현재 다음 방법을 사용하여 내용을 읽습니다. BufferedReader in = new BufferedReader(new InputStreamReader(page.openStream())); String inputLine; while ((inputLine = in.readLine()) != null) {

    0

    1답변

    realtor.com에서 매개 변수를 얻기 위해 웹 수확 라이브러리를 사용하여 웹 스크래퍼를 작성하려고합니다. 그것을하는 방법에 대한 좋은 자습서가 있습니까? 이클립스 IDE를 사용하고 있습니다

    0

    1답변

    웹 수확물을 사용하여 웹 페이지에서 특정 콘텐츠를 긁어 내고 싶습니다. 내용을 긁어 내려고했을 때 다른 웹 사이트에서 잘 작동하지만 this URL의 내용을 긁어 모으지 않습니다. import org.webharvest.definition.ScraperConfiguration; import org.webharvest.runtime.Scraper; imp

    1

    1답변

    웹 수확을 사용하여 일부 웹 페이지 "스크랩"을 수행하고 있습니다. 나는 조직 할 가치가있는 표를 가지고있다. 테이블은 매우 간단합니다. 그러나 테이블의 열 머리글을 사용하여 각 열의 데이터 형식을 결정해야합니다. 웹 수확의 예와 같이 테이블은, 내가 XQuery를 사용하고 <table> <tr class="header"> <td>Name

    0

    2답변

    일부 전자 상거래 사이트를 스크랩하기 위해 웹 수확을 사용하고 있습니다. 검색 페이지를 반복하고 각 제품 세부 정보를 출력 xml로 가져옵니다.하지만 지금 앵커에서 정규 표현식을 사용하고 싶습니다. (a)에 태그를 긁어 특히 string.ie를 얻을 수 있지만, let $linktoprod :=data($item//a[@class="fk-anchor-lin