DB에 정보를 저장하기 위해 PIG 및 HBASE를 사용하고 있습니다. DUMP 명령에서 가져온 데이터 세트를 가지고 있으며 다음 단계에서 HBASE에 저장하려고합니다.Hbase 및 PIG가 모든 행을 저장하지 않습니다
DUMP somedata;
은 아래와 같이 중복 행을 갖는 데이터 청크를 생성합니다.
(rowkey, cf:1, cf:2 ....)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
HBaseStorage로 somedata를 저장하기 위해 STORE 명령을 사용하면 모든 중복 행이 제거되고 별개의 행이 저장됩니다. 나는 예상 된 행동이 아닌지 확신 할 수 없다. 위 밖으로
만이
(12345::456::idea, 4567, deleted, 2.3, next, super)
(12345::456::idea, 4568, deleted, 2.3, next, super)
(12345::456::idea, 4569, deleted, 2.3, next, super)
를 저장 그리고 그것은 미스에게 약간의 행을 수행 어떤 시간도 저장합니다.
어느 누구도 이것을 명확히 할 수 있습니까?
plz 코드 및 hbase 테이블 정의를 추가 할 수 있습니까? – 54l3d