0
나는 거의 100 개의 회사 웹 사이트를 가지고 있습니다. contact_us 페이지 링크. 각 contact_us 페이지에있는 모든 회사 위치를 수집해야합니다. Jsoup를 사용하려하지만 Jsoup를 사용하여 구현하는 경우 한 회사에만 해당됩니다. 일반 구현을 구현해야합니다.자바에서 핵심어를 사용하여 HTML 페이지 구문 분석
나는 다음과 같은 전략을 고려하고 우리가 등 사무실, 본사, 같은 키워드를 찾을 이제까지
- 내가 그 블록을 읽을 생각했다. 나는 모든 주소를 수집 할 수 있고,이 페이지에서 http://www.directenergysolar.com/company/contact-us/
:
예를 들어,이 링크를 참조하십시오.
이것을 구현하는 더 좋은 방법이 있습니까?
https://jsoup.org/ – NemanjaT
@NemanjaT jsoup 사용 특정 구현을 구현할 수 없습니다 – PSR
아마도 모든 HTML 태그를 제거한 다음 정규식을 사용할 수 있습니까? – 4castle