Apache Beam을 사용하여 Hive를 읽는 방법/Apache Beam에서 Hive를 소스로 사용하는 방법은 무엇입니까?Apache Beam을 사용하여 Hive에서 읽는 방법은 무엇입니까?
1
A
답변
0
HadoopInputFormatIO은 다음과 하이브에서 읽을 수 있습니다 :
Configuration conf = new Configuration();
conf.setClass("mapreduce.job.inputformat.class", HCatInputFormat.class,
InputFormat.class);
conf.setClass("key.class", LongWritable.class, WritableComparable.class);
conf.setClass("value.class", DefaultHCatRecord.class, Writable.class);
conf.set("hive.metastore.uris", "...");
HCatInputFormat.setInput(hiveConf, "myDatabase", "myTable", "myFilter");
PCollection<KV<LongWritable, DefaultHCatRecord>> data =
p.apply(HadoopInputFormatIO.<Long,
DefaultHCatRecord>read().withConfiguration(conf));
0
끌어 오기 요청 7 월 2017 년 통합 할 수 있습니다 Beam 2.1.0
을 HCatalog
https://issues.apache.org/jira/browse/BEAM-2357를 통해 hive
을 지원합니다.
대답을 quesion과 함께 쓰지 말고 게시하십시오. –