腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
多个
客户端
数据
加载
到Hadoop
的
最佳实践
sql-server
、
hadoop
、
hive
、
sqoop
、
cloudera-quickstart-vm
我们正在
使用
Cloudera在Hadoop框架上创建POC。我们希望将
多个
客户端
的
数据
加载
到
Hive
表
中
。 到目前为止,我们对Server上
的
每个客户端都有单独
的
数据
库。我们有一些主维度
表
,它们对每个客户端都是相同
的
。所有客户端
数据
库都有完全相同
的
架构。这些
表
具有相同
的
主键值。到目前为止,这是
浏览 4
提问于2016-01-27
得票数 2
回答已采纳
1
回答
使用
多个
字符集
加载
hive
表
中
的
数据
character-encoding
、
hive
、
hdfs
我遇到
的
问题是,我有
多个
具有不同
字符集
的
文件,例如一个文件具有中文
字符集
,另一个文件具有法国
字符集
,我如何将它们
加载
到单个配置子表
中
?我在网上搜索,发现了这个:-有了这个,我可以处理其中一个文件
的
字符集
有没有办法一次性处理两个
字符集
?好
的
浏览 12
提问于2017-01-26
得票数 4
1
回答
当尝试将hdfs
中
的
csv文件
加载
到
hive
表
时没有选择行
hadoop
、
hive
、
hdfs
然后,我连接到
Hive
,并尝试
使用
以下语句创建一个外部
表
,指定我
的
csv文件在hdfs
中
的
位置:当我执行这个命令时,它是在
hive
上创建一个外部
表
浏览 0
提问于2018-03-30
得票数 0
1
回答
如何
使用
apache nifi将
多个
json文件
加载
到具有正确映射
的
多个
hive
表
中
?
hadoop
、
hive
、
bigdata
、
apache-nifi
我需要
使用
apache nifi将基于
表
名
的
多个
csv文件摄取到它们各自
的
配置单元
表
中
。源json文件
中
的
table_address
数据
应该转到配置单元
中
的
table_address,其他
表
也是如此。简而言之,需要将源json文件
中
的
记录分离到
多个
tablename.csv格式
的
csv文件<e
浏览 6
提问于2019-04-10
得票数 0
1
回答
将胞外部
表
更改为同一
数据
库
中
的
内部
表
也会删除另一个
表
中
的
数据
。
java
、
hadoop
、
hive
、
hiveql
、
hive-table
我一直试图
使用
以下语句删除一个
hive
外部
表
落地式台架;此命令还从该
数据
库
中
的
其他单元
表
中
删除
数据
。此外,如果有任何方法,我们只能删除一个外部
表
,这是提到
的
,而不松散
的
其他
数据
。
浏览 1
提问于2019-01-29
得票数 3
1
回答
Apache
中
的
字符集
、口音、特殊字符
hadoop
、
character-encoding
、
hive
、
diacritics
问题Variat� cancel
浏览 1
提问于2015-04-29
得票数 2
3
回答
蜂窝:如果我手动将
数据
文件复制到
表
的
位置文件夹中会发生什么?
hive
、
hdfs
、
load
我尝试将
数据
文件复制到
表
的
location文件夹
中
(而不是
使用
load命令),它
的
工作原理是我可以查询新
数据
。但是,我所看到
的
所有源都将
使用
load命令来执行此操作;它们从不谈论将
数据
文件直接复制到location文件夹。我给人
的
印象是,直接将文件复制到location文件夹并不是个好主意,但我看不出有什么解释可以解释为什么这是个坏主意。 有人知道为什么不应该将
数据
文件直接复制到<
浏览 0
提问于2018-12-25
得票数 1
回答已采纳
2
回答
何时
使用
Sqoop -创建-蜂窝
表
hive
、
sqoop
有人能分辨出create-
hive
-table和
hive
-import方法
的
区别吗?两者都会创建一个蜂巢
表
,但每个
表
的
意义究竟是什么?
浏览 1
提问于2015-07-20
得票数 5
1
回答
如何
加载
和存储nvarchar
hadoop
、
character-encoding
、
hive
、
sqoop
、
nvarchar
堆栈:
使用
Ambari2.1安装HDP-2.3.2.0-2950 -以下步骤: 在执行sqoop导入命令时,我没有
使用
任何与charset/unicode/utf-8相关
的
内容,导入也成功了。在创建
Hive
外部
表
时,我想知道应该为原始sql服务器
表
中
的</em
浏览 3
提问于2016-05-04
得票数 0
2
回答
如何
使用
python脚本将excel
数据
加载
到单元格
中
?
python
、
python-3.x
我需要一个python脚本来
使用
python将
多个
excel
表
数据
加载
到
hive
表
中
。任何人在这方面有帮助。
浏览 11
提问于2020-03-31
得票数 0
5
回答
Hive
如何存储
数据
(从HDFS
加载
)?
hadoop
、
hive
、
hbase
、
hdfs
、
bigdata
在试图理解
数据
访问层(如
Hive
)
的
基本原理时,我需要了解表
的
数据
(在
Hive
中
创建)究竟存储在哪里?我们可以在
Hive
中
创建外部和内部
表
。由于外部
表
可以在HDFS或任何其他文件系统
中
,因此
Hive
不将此类
表
的
数据
存储在仓库
中
。内部桌子呢?此
表
将作为Hadoop集群上<em
浏览 11
提问于2015-10-28
得票数 4
2
回答
加载
或指向
多个
拼板路径,用于用蜂巢或预存储程序进行
数据
分析
amazon-s3
、
apache-spark
、
hive
、
parquet
、
presto
我喜欢做
的
是拆分一个AWS EMR集群,并将拼板文件
加载
到HDFS
中
,并对其运行我
的
查询。我已经知道了如何用蜂巢创建
表
,并将其指向一个s3路径。但这就限制了我
的
数据
只有一天。因为日期
的
每一天都有
多个
文件在路径下,如因此,问题之一是如何将多天
的
数据
<e
浏览 5
提问于2016-04-14
得票数 2
1
回答
在配置单元中
加载
数据
时处理
多个
分隔符
hive
、
sqoop
我
使用
sqoop从db2导入
数据
,并
使用
'|‘作为字段delimiter.Then,
使用
load data命令将这些
数据
加载
到
hive
表
中
。在
hive
table create语句中,我也
使用
了字段分隔符作为'|‘,但从源端为一列,我在
数据
本身中找到了30个记录
中
的
1M个记录
中
的
'
浏览 12
提问于2020-09-30
得票数 0
回答已采纳
3
回答
将
数据
从HDFS复制到配置单元
中
的
外部
表
时出错
hadoop
、
hive
我正在尝试将hdfs
中
的
数据
插入配置单元
中
的
外部
表
。但是得到了低于错误。Usage: java FsShell [-put <localsrc> ...<dst>]命令 table location : hdfs://sandbox:8020
浏览 0
提问于2018-07-03
得票数 2
2
回答
如何
使用
create-
Hive
-table在配置单元
中
创建
表
时
使用
自定义分隔符
mysql
、
hadoop
、
hive
、
sqoop
我正在尝试将
数据
从RDBMS
表
导入HDFS。然后,我
使用
create-
hive
-table将模式复制到配置单元,然后将
数据
加载
到该配置单元
表
。testingsqoop -m 1 --fields-terminated-by ',' --enclosed-by "\'" --lines-terminated-by "\n" 用于创建配置单元
表
的
命令"\n
浏览 5
提问于2016-01-27
得票数 1
2
回答
在带有蜂巢
的
特定单词之前提取文本
regex
、
string
、
hadoop
、
text
、
hive
我在列中有如下所示
的
数据
: 提前谢谢。
浏览 5
提问于2017-09-08
得票数 0
回答已采纳
2
回答
创建外部
表
但warehose为空?
hadoop
、
hive
我
使用
的
是
hive
v0.13 我
的
数据
存储在hdfs
中
,我
使用
create "CREATE external TABLE"为这些
数据
创建一个
表
。一切正常,我可以发出"select"语句。问题在仓库目录(
hive
.metastore.warehouse.dir)下,我没有看到添加任何files/data,这正常吗?我知道
使用
"externa
浏览 1
提问于2015-06-04
得票数 0
1
回答
是否可以将蜂巢
数据
加载
到Vora
中
?
hive
、
sap
、
hana
、
vora
到目前为止,我能够将CSV和ORC文件从HDFS
加载
到Vora,但能够从
Hive
加载
吗?在没有将
Hive
指定为源
的
情况下,我尝试
使用
等于/app/
hive
/仓库/tablename/00000_0
的
“路径”(或任何部分文件名)。但是,如果一个
Hive
表
是由/tablename/目录
中
的
多个
文件表
浏览 2
提问于2016-06-02
得票数 0
回答已采纳
2
回答
如何将
多个
文本文件组合到一个
Hive
表
中
sql
、
hadoop
、
hive
我目前正在尝试编写一个
Hive
脚本,以获取目录路径,并生成一个
Hive
表
,将路径
中
的
所有不同文件组合在一起。我已经找到了如何
加载
文件,因为我知道直接路径到他们,但我如何做到这一点,而不知道所有的文件路径?如果我知道给定目录/combine
的
路径,我就会这样做:LOAD DATA INPATH'
浏览 1
提问于2018-04-27
得票数 0
回答已采纳
2
回答
AWS
数据
管道:将
数据
转储到3个s3节点
amazon-web-services
、
aws-lambda
、
aws-data-pipeline
我有一个用例,其中我想从DynamoDB获取
数据
并对
数据
进行一些转换。在此之后,我希望创建3个csv文件(相同
数据
上将有3个转换),并将它们转储到3个不同
的
s3位置。我
的
架构应该是这样
的
: 是否可以这样做呢?我似乎找不到任何关于它
的
文件。如果不可能
使用
管道,还有其他服务可以帮助我处理用例吗? 这些垃圾场将每天安排。我
的
另一个考虑是
使用
aws lamda。但根据我
的
理解,它是基于事件触发
浏览 2
提问于2019-02-22
得票数 0
回答已采纳
点击加载更多
相关
资讯
使用zabbix监控oracle中的表数据
大数据入门基础系列之浅谈Hive的桶表
大数据入门基础系列之浅谈Hive的分区表
按照分类将 Excel 数据表拆分后,保存在多个工作表中
如何按照 Excel 中的目录,从多个工作表中查找出完整数据?
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券