복잡한 웹 페이지의 테이블을 구문 분석하기 위해 HTML 민첩성 팩을 사용하고 싶지만 개체 모델에서 어떻게 든 사라졌습니다.HTML 민첩성 팩 - 구문 분석 테이블
링크 예제를 살펴 보았지만 이런 식으로 테이블 데이터를 찾지 못했습니다. XPath를 사용하여 테이블을 가져올 수 있습니까? 기본적으로 테이블을 가져 오는 방법에 대한 데이터를로드 한 후에 기본적으로 손실됩니다. 이전에 Perl에서이 작업을 수행했지만 조금 어색했지만 작업했습니다. (HTML::TableParser
).
구문 분석을 위해 올바른 개체 순서를 밝힐 수 있다면 기쁘게 생각합니다.
안녕하세요. 큰 파일을 파싱하는 것에 대한 조언을 부탁해 주시겠습니까? 50 MB 파일을 초과하여 하위 tr 노드를 가져올 수 없습니다. –
@Marc - 테이블이 페이징이면 긁어서 다음 페이지로가는 방법 –
@Dark_Knight 원본 페이지가 사용 된 모든 아약스 경로를 타격해야합니다. –