2016-09-20 4 views
3

이 프로젝트를 사용하고 있습니다 : https://github.com/lucidworks/hadoop-solr 처리중인 문서의 이름 (또는 경로)이 저장된 값을 알고있는 사람이 있습니까? 이 값을 Solr Admin으로 가져 와서 스키마에 이름이있는 필드를 추가하려고합니다. 이것이 가능한가?"Hadoop-Solr Lucidworks Project"가 입력 이름 경로를 검색합니다.

예 : 쿼리에서 동일한 결과를 반환하는 문서의 이름을보고 싶습니다. 파일 경로가 현재 어떤 SOLR 필드에 추가되지 않습니다 CSVIngestMapper를 들어

hadoop jar solr-hadoop-job-2.2.5.jar 
    com.lucidworks.hadoop.ingest.IngestJob 
    -Dlww.commit.on.close=true -DcsvDelimiter= 
    -cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1 
    - i /usr/local/hadoop/input 
    -of com.lucidworks.hadoop.io.LWMapRedOutputFormat 
    -s http://127.0.1.1:8983/solr 

답변

2

(솔루션에 대한 https://github.com/lucidworks/hadoop-solr/issues/16 참조) :

hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob 
    -Dlww.commit.on.close=true 
    -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\\w+" 
    -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss 
    -cls com.lucidworks.hadoop.ingest.RegexIngestMapper 
    -c collection1 -i /path/* -s http://127.0.1.1:8983/solr 
    -of com.lucidworks.hadoop.io.LWMapRedOutputFormat 

또한 추가 정보를 원하시면 this를 참조하십시오.

1

:

내가이 명령을 사용하여 프로젝트를 실행하고 있습니다.

언제든지 repo에서 문제를 만들 수 있습니다. https://github.com/lucidworks/hadoop-solr

또한의 PR 환영

편집이다 : 이것은 나를 위해 일한

+0

결과가 속한 문서의 이름이나 경로를 검색하는 방법이 있습니까? 내가 2 txt 문서를 사용하고 있다면 어떻게 결과가 나왔는지 txt 알아 내야합니다. 다른 Ingest Mapper에서 사용할 수 있습니까? @acesar –

+1

> 다른 Ingest Mapper에서도 사용할 수 있습니까? 예, RegexIngestMapper/GrokIngestMapper는 path라는 필드를 추가합니다. 하지만 유스 케이스를 따르고 있는지 확실하지 않습니다. – acesar

+0

내 컬렉션에 "data_driven_schema_configs"를 사용하고 있습니다. 필드는 data_driven_schema_configs 권한의'managed-schema' 안에 추가되어야합니까? @acesar –