Eclipse에 solr 5.5.0 및 hbase 0.90.6으로 apache nutch 1.13을 구성했습니다. 이제 인젝터에서 인버트 링크로 작업을 실행할 수 있지만 인덱싱 작업을 실행하는 동안 "Missing elastic.cluster and elastic.host ...."오류가 발생합니다. nutch-site.xml 파일의 plugin.includes에서 indexer-solr을 설정했습니다. 하지만 여전히 이러한 오류가 발생합니다. 아무도 왜 이런 일이 일어나고 있는지 도울 수 있습니까?이클립스에서 nutch로 인덱서 작업을 실행하는 중에 "missing.club and elastic.host ...."오류 발생
0
A
답변
0
문제는 nutch-site.xml에서 발생합니다. 두 개의 nutch-site.xml이있는 것을 보면; 하나는 conf 폴더 아래에 있고 다른 하나는 src/test 폴더에 있습니다. 일반적으로 conf 디렉토리에 nutch-site.xml 파일을 설정합니다. 그러나 eclipse에서 가져올 때 src/test 폴더 아래에있는 파일을 고려합니다. 따라서이 오류를 수정하는 방법은 src/test 폴더 아래에서 설정을 구성하는 것입니다. 당신이 SOLR 다음 등 인덱서-SOLR, 탄성 다음 인덱서 탄성 및 사용 사용하려는 경우 일반적으로 해당 파일이 아주 기본적인 설정을 포함, 아래 라인 그래서
<property>
<name>plugin.includes</name>
<value>protocol-http|urlfilter-regex|parse-(html|tika)|index-(basic|anchor)|indexer-solr|scoring-opic|urlnormalizer-(pass|regex|basic)</value>
<description>Regular expression naming plugin directory names to
include. Any plugin not matching this expression is excluded.
In any case you need at least include the nutch-extensionpoints plugin. By
default Nutch includes crawling just HTML and plain text via HTTP,
and basic indexing and search plugins. In order to use HTTPS please enable
protocol-httpclient, but be aware of possible intermittent problems with the
underlying commons-httpclient library. Set parsefilter-naivebayes for classification based focused crawler.
</description>
</property>
와
<property>
<name>plugin.includes</name>
<value>.*</value>
<description>Enable all plugins during unit testing.</description>
</property>
를 교체해야 .
희망이 다른 도움.