나는 레코드에서 실제 삭제를하지 않으며 hbbase가 삭제 표시를 설정한다는 것을 알고 있습니다. 그러나 데이터 양이 커지면 언젠가 선택한 행 중 일부에서 하드 삭제 (실제 삭제)를 수행하여 크기를 줄이려고합니다.HBase에서 하드 삭제 (실제 삭제)를 수행하는 방법이 있습니까?
1
A
답변
0
삭제 마커 및 삭제 된 셀은 주요 압축 중에 제거됩니다. 사소한 컴팩 션은 작은 HFile을 더 크게 병합합니다. 다음 명령을 사용하여 주요 압축을 수동으로 트리거 할 수 있습니다.
major_compact "table name"
압축 (보조 및 주요)은 온라인 작업입니다. 압축을 수행하기 위해 유지 관리 창이 필요하지 않습니다.
중요한 압축은 모든 HFile을 재구성하므로 시간이 오래 걸릴 수 있습니다. 로드가 많은 시스템의 성능에 부정적인 영향을주지 않으려면 사용량이 많은 시간대에 압축을 계획하는 것이 좋습니다.
주요 압축은 자동으로 수행됩니다 (기본적으로 7 일마다). 예정된 주요 압축의 빈도는 hbase.hregion.majorcompaction
매개 변수를 통해 제어됩니다.
마이너 압축도 메이저로 확대 될 수 있습니다.
자세한 내용은 우수 HBase Reference Guide을 제안합니다.
안녕하세요 이반, 답변 해 주셔서 감사합니다! 주요 압축은 종료 또는 재부팅이 필요합니까? 어떤 프로덕션 호스트에서도 사용할 수 있습니까? – Olivia
온라인 작업입니다. 재부팅이나 시스템 종료는 필요하지 않습니다 (일반적으로). 압축 중에 발생하는 쓰기는 memstore에 저장됩니다. –