0
Apache Spark을 사용하여 HBase에서 데이터를 읽으려고합니다. 하나의 특정 열만 스캔하려고합니다. 내가 문자열의 JavaRDD
에 JavaPairRDD
을 변환 할 경우JavaPDDRDD <ImmutableBytesWritable, Result>을 JavaRDD로 변환 <String>
SparkConf sparkConf = new SparkConf().setAppName("HBaseRead").setMaster("local[2]");
JavaSparkContext sc = new JavaSparkContext(sparkConf);
Configuration conf = HBaseConfiguration.create();
conf.set("hbase.zookeeper.quorum", "localhost:2181");
String tableName = "myTable";
conf.set(TableInputFormat.INPUT_TABLE, tableName);
conf.set(TableInputFormat.SCAN_COLUMN_FAMILY, "myCol");
JavaPairRDD<ImmutableBytesWritable, Result> hBaseRDD = sc.newAPIHadoopRDD(conf, TableInputFormat.class,
ImmutableBytesWritable.class, Result.class);
은 아래처럼 내 HBase와 데이터의 RDD을 만드는 오전.
JavaRDD<String> rdd = ...
어떻게하면됩니까?