아래의 명령을 사용하여 하이브에서 최근 3 개월 데이터를 가져옵니다. select * from xyz 여기서 '2017-01-06 00:00:00'과 '2017-03-06 23:59:59'사이의 creat_ts는 어디입니까? 키워드를 사용하지 않고 하이브로 지난 3 개월 데이터를 가져 오는 방법.
12 개의 파일을 하나의 파일로 병합 한 다음 수백만 개의 데이터가있는 하이브 외부 테이블에 푸시 된 많은 CSV 파일이 있으며이를 기계 학습 팀에 제공합니다. CSV 파일은 Phonenumber, Col1, Col2 ..... Created_date가있는 원시 파일입니다. 12 개의 csv 파일을 하나의 csv 거대한 csv 파일로 병합하여 하이브 외부
과 같은 테이블 표시 임팔라로 작업 중이며 아래의 패턴으로 데이터베이스에서 테이블 목록을 가져 오는 중입니다. 데이터베이스가 bank 인 것으로 가정하고이 데이터베이스 아래의 테이블은 아래와 같습니다. cust_profile
cust_quarter1_transaction
cust_quarter2_transaction
product_cust_xyz
.
이 작업에 대한 진단 메시지 : 컨테이너 [pid = 3347, containerID = container_1490354262227_0013_01_000104]가 실제 메모리 제한을 초과하여 실행 중입니다. 현재 사용 : 1.0GB의 1GB 실제 메모리가 사용되었습니다. 1.5GB의 5GB 가상 메모리가 사용되었습니다. 컨테이너를 죽이는. 컨테이너에 대한
t2에없는 레코드 만 삽입하는 다른 테이블 t2의 테이블 t1에 레코드를 삽입해야합니다. 그러나이 쿼리를 사용하면 테이블 t1에 * select t2에서 ID를 삽입 할 수 없습니다 (t1에서 ID 선택). 는하지만 자격을 갖춘 열 참조를 포함 할 수 없습니다 발현의 상관 관계 로 오류가 발생합니다. 아무도 나에게이 작업을 수행 할 쿼리를 제안 할 수 있습
업데이트 문을 사용하면 다음과 같은 응답이 표시됩니다. 업데이트는 T1 = t1.id t2.id, t1.name = t2.name, t1.age = t2.age 설정 곳 (T1로부터 ID를 선택)에 t2.id; 실패 : SemanticException [오류를 10294] : 갱신을하거나 이러한 작업을 지원하지 않는 트랜잭션 관리 프로그램을 사용하여 삭제하
하이브에서 실행할 몇 가지 insert 문이 있습니다. 나는 그들을 .hql 파일에 넣고 beeline -f 옵션을 통해 실행할 계획이다. 진행 상황을 알 수 있도록 삽입 사이에 일부 로그 메시지를 반향시킬 수있는 방법이 있습니까? 마찬가지로 : 에코 insert1 는 insert2 는 "삽입 스크립트가 완료"에코 "완전한 1 삽입" 에코 "........
hiveconf 변수의 이름에 점을 사용할 수 있습니까? documentation의 모든 예제는 a과 같은 간단한 변수 이름을 표시합니다. 예 경우 : 내가 HQL 스크립트에서 참조 어떻게 ? select ${hiveconf:airflow.ctx.dag.dag_id} as dag_id;은 구문 오류를 발생시킵니다 (${hiveconf:abcd}은 ok입니다
HiveQL을 사용하여 아래 쿼리를 실행하고 있습니다. 의도는 case 문이 접미사 (.com, .co.uk)에 따라 도메인 끝에있는 마지막 XX 문자를 제거한다는 것입니다. 출력에서 'domainnew'열의 문자열이 변경되지 않았으므로 작동하지 않는 것 같습니다. 누구든지이 작업을 어떻게 수행 할 것이라고 조언 할 수 있습니까? 또한 'domainne