0
HTML 콘텐츠 필터링을 위해 추출기 플러그인으로 Apache Nutch, Solr을 구성했습니다. 어떻게 CSS 엔진 또는 xpath 엔진을 사용하여 내부 div 콘텐츠에 액세스 할 수 있습니다. 미리 감사드립니다. 필터링 프로세스에서 추출기 플러그인의 CSS 엔진으로 내부 html 콘텐츠에 액세스하는 방법
HTML 콘텐츠 필터링을 위해 추출기 플러그인으로 Apache Nutch, Solr을 구성했습니다. 어떻게 CSS 엔진 또는 xpath 엔진을 사용하여 내부 div 콘텐츠에 액세스 할 수 있습니다. 미리 감사드립니다. 필터링 프로세스에서 추출기 플러그인의 CSS 엔진으로 내부 html 콘텐츠에 액세스하는 방법
그냥 "텍스트"기능을 사용하십시오. 예를 들어 당신의 HTML은 다음과 같이되어있는 경우 : 다음 당신의 추출물은-하는 규칙
<div class="target">
Hello <span>World!</span>
</div>
이 유사합니다
<extract-to field="my-field">
<text>
<expr value=".target"/>
</text>
</extract-to>
당신이 tahagh 감사, 내가 해보자하고 same.Thanks에 대해 알려 도움을 청합니다. –