2017-10-05 9 views
0

Eclipse에 solr 5.5.0 및 hbase 0.90.6으로 apache nutch 1.13을 구성했습니다. 이제 인젝터에서 인버트 링크로 작업을 실행할 수 있지만 인덱싱 작업을 실행하는 동안 "Missing elastic.cluster and elastic.host ...."오류가 발생합니다. nutch-site.xml 파일의 plugin.includes에서 indexer-solr을 설정했습니다. 하지만 여전히 이러한 오류가 발생합니다. 아무도 왜 이런 일이 일어나고 있는지 도울 수 있습니까?이클립스에서 nutch로 인덱서 작업을 실행하는 중에 "missing.club and elastic.host ...."오류 발생

답변

0

문제는 nutch-site.xml에서 발생합니다. 두 개의 nutch-site.xml이있는 것을 보면; 하나는 conf 폴더 아래에 있고 다른 하나는 src/test 폴더에 있습니다. 일반적으로 conf 디렉토리에 nutch-site.xml 파일을 설정합니다. 그러나 eclipse에서 가져올 때 src/test 폴더 아래에있는 파일을 고려합니다. 따라서이 오류를 수정하는 방법은 src/test 폴더 아래에서 설정을 구성하는 것입니다. 당신이 SOLR 다음 등 인덱서-SOLR, 탄성 다음 인덱서 탄성 및 사용 사용하려는 경우 일반적으로 해당 파일이 아주 기본적인 설정을 포함, 아래 라인 그래서

<property> 
    <name>plugin.includes</name> 
    <value>protocol-http|urlfilter-regex|parse-(html|tika)|index-(basic|anchor)|indexer-solr|scoring-opic|urlnormalizer-(pass|regex|basic)</value> 
    <description>Regular expression naming plugin directory names to 
    include. Any plugin not matching this expression is excluded. 
    In any case you need at least include the nutch-extensionpoints plugin. By 
    default Nutch includes crawling just HTML and plain text via HTTP, 
    and basic indexing and search plugins. In order to use HTTPS please enable 
    protocol-httpclient, but be aware of possible intermittent problems with the 
    underlying commons-httpclient library. Set parsefilter-naivebayes for classification based focused crawler. 
    </description> 
</property> 

<property> 
    <name>plugin.includes</name> 
    <value>.*</value> 
    <description>Enable all plugins during unit testing.</description> 
</property> 

를 교체해야 .

희망이 다른 도움.