모든 영어 정의를 검색하기 위해 위키 백과 항목을 구문 분석하려고합니다. 나는 모든 정의를 되 찾을 수 있으며, 일부 정의는 다른 언어로되어있다. 내가하고 싶은 것은 어쨌든 영어 정의가있는 HTML 블록 만 가져옵니다. 나는 다른 언어 항목이있는 경우, 영어 정의 후 헤더로 검색 할 수 있다는 것을 발견했다 : hpricot/nokogiri에서 h2 요소 앞에있는 모든 요소 검색
header = (doc/"h2")[3]
그래서 난 단지이 헤더 요소 전에 모든 요소를 검색하고 싶습니다.
header.preceding_siblings()
으로 가능할 수도 있다고 생각했지만 작동하지 않는 것 같습니다. 어떤 제안?