2016-07-18 10 views
0

나는 거의 100 개의 회사 웹 사이트를 가지고 있습니다. contact_us 페이지 링크. 각 contact_us 페이지에있는 모든 회사 위치를 수집해야합니다. Jsoup를 사용하려하지만 Jsoup를 사용하여 구현하는 경우 한 회사에만 해당됩니다. 일반 구현을 구현해야합니다.자바에서 핵심어를 사용하여 HTML 페이지 구문 분석

나는 다음과 같은 전략을 고려하고 우리가 등 사무실, 본사, 같은 키워드를 찾을 이제까지

예를 들어,이 링크를 참조하십시오.

이것을 구현하는 더 좋은 방법이 있습니까?

+0

https://jsoup.org/ – NemanjaT

+0

@NemanjaT jsoup 사용 특정 구현을 구현할 수 없습니다 – PSR

+1

아마도 모든 HTML 태그를 제거한 다음 정규식을 사용할 수 있습니까? – 4castle

답변

0

당신이 목표로하는 목표는 확실히 도달 할 수 있습니다. Jsoup는 최종 솔루션의 일부분에 지나지 않습니다.

"extracting info from random webpage using JSOUP" 대답을 참조하십시오

  • 세의
  • 기계
  • Jsoup 학습 ​​
  • 믹스 소싱 군중 위의 접근 :

    기본적으로, 여기 네 가지 옵션 볼 수 있습니다 옵션에 대한 자세한 내용은