webharvest

    0

    1답변

    오픈 소스 웹 스크래핑 도구 인 web harvest (http://web-harvest.sourceforge.net/)를 사용하고 있습니다. 사용하려고하는 정규식에는 "<", ">"문자가 있습니다 (들어오는 모든 HTML 태그를 제거하려고하기 때문에). 요소의 내용이 올바른 형식의 문자 데이터 또는 마크 업으로 구성되어야하기 때문에 문제가 발생합니다. 어

    0

    1답변

    다음 코드를 사용하여 구문 분석 할 웹 페이지를 가져 오려고합니다. <var-def name="parameter">value</var-def> <var-def name="url">http://www.example.com/script</var-def> <html-to-xml> <template> <http method="get" url

    0

    1답변

    웹 수확을 사용하여 사이트에서 일부 데이터를 추출하고 있습니다. Site는 Code이라는 POST 변수를 가져오고 그에 따라 데이터를 제공합니다. 사용 가능한 코드는 해당 사이트의 다른 페이지에서 수집됩니다. 어떻게 변수와 같은 배열을 정의하여 변수와 같은 배열에 코드와 관련된 데이터를 저장하면 주 프로그램에서 루프를 사용하여 해당 변수를 검색 할 수 있습

    1

    2답변

    웹 페이지에서 데이터를 검색하고 긁어 데이터베이스에 저장하는 데 유용한 오픈 소스 Java 라이브러리는 무엇입니까? <tr><td><b>Address:</b></td> <td colspan=3>123 My Street </td></tr> "주소 :"예를 들어, 내가 같은 페이지가 있다고 가정의 핵심이지만, 사실 그 사이에 html 태그 및 공간의 무