2017-12-20 26 views
1

동일한 소스 XML에서 Accumulo와 Solr 모두로 수집 된 데이터를 비교하려고합니다. Accumulo로 수집 된 데이터는 기존 코드이며 Solr은 새로운 코드입니다. Solr에서 SolrCloud를 사용하여 데이터를 쉽게 추출하고 쉽게 읽을 수있는 CSV 또는 JSON을 선택할 수 있습니다. 그러나 나는 Accumulo에서 데이터를 쉽게 볼 수있는 방법을 놓치고 있습니다. 데이터를보기 위해 스캔을 사용했지만 쉽게 읽을 수는 없습니다. Accumulo의 데이터를 CSV 또는 유사한 데이터로 내보내 다른 데이터 세트와 쉽게 읽고 비교할 수있는 방법이 있습니까?Accumulo 대 Solr에서 데이터 비교하기?

답변

1

잘 알고 있듯이 Apache Solr은 Lucene 색인을 사용하여 웹 기반 REST 인터페이스를 통해 빠르게 검색 할 수있는 문서 저장소입니다. 한편 Apache Accumulo은 Java API로 쿼리 할 수있는 사용자 응용 프로그램에 따라 셀 수준 보안 레이블이있는 임의의 키 - 값 쌍을 저장하는 대량 확장 가능한 정렬 된 키 - 값 저장소입니다. 이 둘을 비교하는 것은 의미가 없습니다. 그들은 완전히 다른 응용 프로그램입니다. Accumulo는 Solr에 필적하는 검색 엔진과 같은 복잡한 시스템을 구축 할 수있는 낮은 수준의 인프라 응용 프로그램이지만 Accumulo는 검색 엔진이 아니기 때문에 Solr과 직접 비교할 수 없습니다.

Accumulo에서 데이터를 보는 방법에 대한 질문에 대답하려면 해당 Java API를 사용하는 것이 좋습니다. 웹 페이지에 Tour으로 시작하는 것이 좋습니다. 쿼리 방법에 대한 예제가 나와 있습니다. 데이터가 어떻게 표시되고 어떤 형식으로 표시되는지는 처음에 데이터를 섭취 한 애플리케이션에 따라 다릅니다. 바이트 배열의 임의의 2 진 데이터 일 수 있으며 직접 볼 수는 없습니다. 그것은 응용 프로그램에 따라 다릅니다. Accumulo는 키 - 값 쌍에 저장된 데이터의 본질에 대해 불가지론 자입니다. , 당신은 아마 Accumulo의 쉘에서 scan 명령을 참조했다 당신은 아마 당신이 를 "나는 데이터를 볼 스캔 사용"라고 질문에 언급 된

. 쉘이 쿼리의 기본 인터페이스가 아니라는 것을 알고 있어야합니다. 시스템 관리 및 데이터 수집의 분류를위한 것입니다. Java API는 쿼리의 기본 수단입니다.

Accumulo 오픈 소스 커뮤니티는 질문에 매우 잘 반응합니다. 필요에 따라 사용하는 것이 최선의 방법인지 알아내는 데 어려움이있는 경우 웹 사이트에서 커뮤니티 메일 링리스트를 찾아 보시기 바랍니다. StackOverflow는 일반화 된 "시작"유형의 자습서보다 매우 구체적인 질문에 더 적합합니다.