我正在尝试找到一种方法,将hbase查询结果读入以制表符分隔的文本文件中。
hbase表people的结构
12 column-name=name;value=John Smith
10 column-name=name;value=Jack Johnson
我想将其输出到一个文本文件中,该文件的创建方式如下:
- 12(tab)John Smith
- 10(tab)Jack Johnson
有没有什么工具可以做到这一点,比如导出可以将hbase输出到hdfs?
我有一个hbase表,其中包含JSON format.So中的一个列,我希望创建一个包含struct>类型的hive外部表。
名为smms的Hbase表:
colum name : nodeid , value : "4545781751" in STRING FORMAT
column name : events in JSON FORMAT
value : [{"id":12542, "status" :"true", ..},{"id":"1477", "status"
在运行spark应用程序时,我会得到以下错误:
16/01/08 15:25:48 INFO SchemaMetadata: Entering synchronized block to initiate
16/01/08 15:25:48 INFO SchemaMetadata: Initializing SchemaMetadata
16/01/08 15:25:48 INFO SchemaMetadata: Schema initialized from database
16/01/08 15:25:48 INFO SchemaMetadata: Registering for not
我创建了一个具有以下属性的配置单元表:
create external table statdata(uid int, user string, loc string, locweather int)
stored as textfile
row format delimited
fields terminated by ','
location '/hive/data/weatherstats’;
Hive表包含5行我手动插入的行。
hive> select * from statdata;
OK
1 john newyork 33
2 rob london 3
我目前有一个新的虚拟盒子的CDH5.1镜像,当我尝试使用spark shell连接到HBase时遇到了一个问题。以下是scala代码:
import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.client.{HBaseAdmin,HTable,Put,Get}
import org.apache.hadoop.hbase.util.Bytes
val conf = new HBaseConfiguration()
val admin = new HBaseAdmin(conf)
下面是错误