500GB의 사본과 파티션이있는 거대한 테이블이 있고 거의 20 억 개의 레코드가 있습니다.행 ID를 사용하여 고유 한 행을 내 보냅니다.
3 개의 열 값이 일치하면 해당 레코드를 선택하는 조건을 작성하려고합니다 (예를 들어 4 개의 중복 레코드가 있음). 그리고 최소/최대 행 ID로 레코드 하나를 내보내십시오.
삭제 나 새 테이블 xyz를 만드는 것과 같은 다른 방법이있을 수 있습니다. 그러나 우리는 수출에 질의 옵션을 사용하여 접근하기로 결정했습니다. 아무도 올바른 구문을 얻을 수 있다면 나를 도와주세요.
내가 함께 시도하고있다 :
query= schema.table:"WHERE ROWID <>
(SELECT MAX(ROWID) FROM schema.table A WHERE A.col1 = A.col1 AND A.col2 = A.col2 AND A.col3 = A.col3)"
하지만이 아마 중복 걸릴 것입니다, 난 그냥 함께 노력 = 및 < = 기호와 저를 도움이되지 이잖아. 그 어떤 행을 수출하지, 0rows 수출 말합니다 그래서 어떤 제안?
주의 : 고유 한 행은 복사하지 않지만 중복 된 행은 내 보내지 않습니다. –
나는 대답을 수정한다, thx, 나는 단지 dubles –