돼지 스크립트를 위해 HbaseStorage를 어떻게 사용자 정의 할 수 있습니까? 사실 돼지 스크립트에로드하기 전에 데이터에 대한 비즈니스 로직을 수행하려고합니다. 그것은 HbaseStorage 위에 사용자 정의 스토리지와 같은 것입니다. 예 : 행 키에 A_B_C와 같은 구조가 있습니다. 현재, 나는 돼지 스크립트에서 HbaseStorage에 A_B_C
일부 HDFS 데이터를 기존 HBase 테이블로 가져 오려고합니다. 필자가 가지고있는 테이블은 2 개의 열 패밀리와 HBase가 새로운 테이블을 생성 할 때 함께 제공하는 모든 기본 설정으로 생성되었습니다. 테이블에 이미 많은 양의 데이터가 채워져 있으며 98 개의 온라인 지역이 있습니다. 행 키 유형은 2-CHARS_ID + 6-DIGIT-NUMBER +
안녕 나는 JSON 문서의 큰 숫자를로드 할 수있는 방법을 찾고 있어요 줄에 하나씩 각 라인의 형식이다 :이 '{id :"id123", "c1":"v1", "c2":"v2", "c3" :"v3"...}'
각 JSON 문서가있을 수 있습니다 알 수없는 필드 수. 돼지에서 이것을 할 수있는 방법이 있습니까? 필드를 hbase의 별도 열에로드하려고합니다.
HBase의 행의 다른 열은 Put을 사용하여 업데이트 할 수 있다는 것을 알고 있습니다. HBaseStorage와 함께 돼지 + HBase를 사용하고 있습니다. 키를 테이블에 존재하지 않는 돼지 표현에 문제없이 HBase에 저장하고로드 할 수 있습니다. 그러나 키가있는 HBaseStorage()가있는 테이블을 업데이트하려고 할 때 작업이 실패합니다. HB
내 학업 프로젝트를 위해 단일 노드에서 hbase (0.94.13)을 실행하고 있습니다. hbase 테이블에 데이터를로드 한 후 HBaseStorage를 사용하여 데이터에 pig (0.11.1) 스크립트를 실행하려고합니다. 내가 돼지 에 사용하고 00 \ 00 \ 여기에 00 \ LOAD 명령입니다 : 아니 호스트 : 포트 쌍 그러나이 , IllegalAr
누구나 HBaseStorage를 사용하여 Bigap의 데이터를 Bigtable에서 데이터를로드하는 데 경험이 있거나 성공 했습니까? 다음은 실행하려고하는 아주 간단한 돼지 스크립트입니다. BigtableConnection 클래스를 찾을 수 없다는 오류가 나타나고 Bigtable에서 데이터를 성공적으로로드하기 위해 누락 된 설정이 궁금합니다. raw = LO
내 시나리오에 NoSQL db 또는 기술/도구를 사용해야한다고 말할 수 있는지 궁금합니다. 우리는 SQL 서버 분석 서비스를 기반으로 한 OLAP 큐브를 오픈 소스 기술로 대체하려고합니다. 데이터가 너무 커져서 관리하기가 너무 어려워지고 쿼리가 너무 오래 돌아 오면 오래 걸릴 것입니다. 우리는 책의 모든 규칙을 따라 데이터를 분할하고 집계 및 파티션 등을
에없는 로컬 단일 노드 하둡 (호튼 웍스) 나는 다음과 같은 오류 얻을에 PredictionIO를 실행하는 경우 : Storage Backend Connections
Verifying Meta Data Backend
Verifying Model Data Backend
Verifying Event Data Backend
E