나는 두 개의 하이브 테이블을 가지고있다. 레코드 수 (함께 aprox) : 5,779,062,484 두 테이블이 3 키가 : LOC_ID (INT), ITEM_ID (INT), week_detail (문자열) 내가 가입하고 (내부 조인) 위의 키를 기준으로 두 테이블 및 결과 데이터의 크기가 같습니다. 예 : 5779062484 참여할 전체 시간은 apr
DROP TABLE 명령을 사용하는 동안 오류가 발생했습니다. 이후 다른 모든 명령에 대해 "FAILED : EXECUTION ERROR"가 표시됩니다. hive> show databases;
OK
default
practice_db
Time taken: 1.305 seconds, Fetched: 2 row(s)
hive> use default;
SQL에서 각 열의 where 절을 사용하여 두 개의 열 개수를 가져 오려고합니다. 지금 person feature1 feature2
a 1 1
a 0 1
a 1 1
a 1 1
a 0 0
a 1 1
b 0 1
c 1 0
가, 내가 원하는처럼 내 데이터를 사람이 그룹에 데이터를보고 난의 0의 어떤을
문제가 발생했습니다. 하이브 외부 테이블에 데이터를 삽입하기 위해 하이브 쿼리를 실행하려고합니다. 프로세스가 감소시 실패합니다. java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: org.apache.hadoop.ipc.RemoteException: java.io.IOE
hivexmlserde-1.0.5.3을 사용하여 XML 데이터를 하이브 테이블로 구문 분석합니다. <item>
<itemid>1</itemid>
<contents subscript = "n">
<name>Item1</name>
<details>Line 1 with a line break.
Line 2 her
2 테이블 (고객, 거래)이 있습니다. customer
id name location
1 samuel AZ
2 mithun CA
3 Robert NY
etc..
transaction
id customer_id product_id
1 1 12000
2 1 12222
3 3 15000
etc.
다른 제품과 내가 하
로드 할 목적으로 일부 csv 경로를 저장하는 하이브 테이블이 있습니다. 일부 데이터를로드 할 때 내 하이브 테이블을 사용하고 싶습니다. 예를 들어 : - LOAD DATA INPATH (select path from my_path_table) OVERWRITE INTO TABLE my_result_table 그것이 하이브와 함께 할 수 있습니까? 감사
나는 회의에 사람의 출석에 대한 다음 JSON 개체가 : 내가 S3 에 저장된 데이터가 어디를 가리키는 테이블을 만들려면 다음 코드를 실행 한 {"conferences_attended": [
{"conference_name": "dreamforce",
"date": "2017",
"city": "san francisco
증분 업데이트를받는 다음 표가 있습니다. 가장 최근의 값을 가진 동일한 키 값을 가진 행을 병합하려면 일반적인 하이브 쿼리를 작성해야합니다. Key | A | B | C | Timestamp
K1 | X | Null | Null | 2015-05-03
K1 | Null | Y | Z | 2015-05-02
K1 | Foo | Bar | Baz | 20