XML 파일의 일부 HTML에서 텍스트의 몇 단락을 추출하기 위해 Perl에서 HTML :: TreeBuilder를 사용하는 가장 좋은 방법을 알아 내려고합니다.HTML을 사용하여 perl에서 단락 찾기 div : TreeBuilder
$tree->address
(또는 내가 생각하기에) 모든 항목이 같은 순서가 아님을 깨달을 때까지 사용했다.
목록에있는 모든 항목을 제외하고 각 항목에 여러 개의 <div>
요소가 있지만 그 중 하나에 <div>
중 하나에만 <p>
개의 요소가있는 것으로 보입니다. 그리고 <div>
에는 아무 것도 없기 때문에 쉽게 만들 수있는 클래스가 없습니다.
나는 여러 가지 방법으로 시도 했으므로 내가 원하는 텍스트를 추출 할 수있는 것은 아무것도 없다. 몇 가지 다른 예를 살펴 보았지만 실제로는 그렇지 않습니다.
$bodyText = $tree->look_down('_tag' => 'div' => 'p');
을하지만 그것은 나에게 오류 제공합니다 :
이런 일이 일을하면 좋을 것
어쨌든param list to look_down ends in a key!
, 어쩌면 누군가가 내가 가진, 올바른 방향으로 날 지점 수 있도록 할 수 있습니다 밤새 보였고, 이제는 내 두뇌가 아파요.
감사합니다.
존
HTML 예제 스 니펫을 추가 할 수 있습니까? – simbabque