腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
无法
从
CSV
文件
使用
Presto
创建
配置
单元
表
、
、
、
、
我想
使用
Presto
创建
一个
配置
单元
表
,数据存储在S3上的
csv
文件
中。 我已经将
文件
上传到S3上,我确信
Presto
能够连接到存储桶。现在,当我给出create table命令时,在查询
表
时,我得到的所有值(行)都是NULL。 我试着调查类似的问题,但发现
Presto
在Stackoverflow上没有那么出名。
文件
中的一些行包括: PassengerId,Sur
浏览 34
提问于2019-06-17
得票数 3
回答已采纳
1
回答
亚马逊S3上的
Presto
、
、
、
我正尝试在亚马逊S3存储桶上
使用
Presto
,但在互联网上找不到太多相关信息。我也不知道为什么我们需要运行hadoop
浏览 2
提问于2016-05-09
得票数 7
3
回答
Presto
和Hive
、
我正在尝试启用位于s3目录中的
CSV
文件
的基本SQL查询。
Presto
看起来很适合(
文件
是10s GB)。当我在
Presto
中进行设置时,我尝试
使用
Hive连接器
创建
一个
表
。我不清楚是只需要hive metastore来保存我在
Presto
中的
表
配置
,还是必须先在那里
创建
它们。 文档表明,您可以
使用
Presto
,而不必
配置
Hiv
浏览 21
提问于2017-02-11
得票数 3
1
回答
在
presto
cli中执行delete查询后,select查询中是否有任何问题?
、
、
我有
presto
hive和hdfs设置,并且我有一个
表
customer,其中包含数据(数据存储在hdfs location /
presto
/customer.avro中)。
配置
单元
表
还包含架构和元数据信息。在
presto
cli中执行select *查询时,它给出了所有3条插入的记录;
从
客户执行delete时,在
presto
cli中,所有数据都被删除。同样,在持久化数据时,它会反映在hdfs客户
文件<
浏览 15
提问于2019-11-20
得票数 0
1
回答
为什么当
presto
服务器在cloudera 6 (CDH6)上时时间戳列值
从
presto
_cli更改?
、
、
、
、
我在CDH6集群上
创建
了一个orc
文件
。在这个orc
文件
的顶部
创建
了hive
表
。此
表
也是
从
presto
使用
presto
单元
连接器查询的。
Presto
安装在同一个CDH6集群上。当
从
presto
_cli v/s hive_cli查询数据时会注意到时间差。
单元
-orcfiledump和
单元
查询都将时间戳列
浏览 6
提问于2021-11-10
得票数 0
1
回答
更新存储在亚马逊网络服务S3中的数据的模式/数据的策略
、
、
、
在我的组织中,我们
使用
亚马逊网络服务S3、和的堆栈来推动一些内部指标的报告。通常,这个堆栈非常适合用于报告原始数据(存储在S3中)的快速设置。我能想到的唯一一件事就是编写一个自定义工具,它遍历S3存储桶,加载
文件
,提供转换,然后将其放回原处,覆盖原始
文件
。不过,似乎必须有更好的方法。
浏览 0
提问于2020-07-17
得票数 1
4
回答
在hdfs中将
配置
单元
表
导出为
csv
、
我知道在Hive中将表格保存为
csv
(或其他文本
文件
)时存在一个分隔符的已知问题。所以我想知道你们能不能帮我解决这个问题。有人能帮上忙吗?
浏览 0
提问于2015-05-14
得票数 10
1
回答
在EMR中为
使用
AWS客户端主密钥加密的数据运行
presto
查询时的解密问题
、
、
、
、
我已经
使用
了您的最新脚本,它成功地在Amazon EMR实例上安装了
presto
服务器(0.99版)和java 8。我的数据
文件
位于
使用
加密的客户端客户管理密钥加密的s3存储桶中。当我在s3中
创建
引用这些加密数据
文件
的
配置
单元
表
时,
配置
单元
可以成功解密记录并将其显示在控制台中。但是,当
从
presto
命令行界面查看相同的外部
表
时,数据以其加密的形式
浏览 1
提问于2015-05-19
得票数 0
3
回答
如何在Amazon上将连接器添加到
presto
、
、
、
我已经安装了一个安装了Hive/
Presto
的小型EMR集群,我希望在S3上查询
文件
并将它们导入RDS上的Postgres。为了在S3上运行查询并将结果保存在postgres中的一个
表
中,我执行了以下操作: /etc/
presto
浏览 7
提问于2016-03-17
得票数 3
1
回答
如何
使用
Trino读取位于s3上的拼花
文件
?
我是S3和Trino的初学者(
Presto
)。我有:安装在现场
使用
码头的Trino(
Presto
)。S3桶,定位
文件
与拼花
文件
扩展。我安装Apache-钻,在盒子里他有s3 conector。/files.parquet` 若要从
文件
拼板中选择所有内容,请执行以下操作。我要在Trino(
Presto
)中这样做,但我没有结果(有错误)。我怎么能在Trino(
Presto
)里做同样的事?:当我
创建
带有选项external_loc
浏览 9
提问于2022-06-27
得票数 1
回答已采纳
0
回答
对在
配置
单元
中以orc格式
创建
且数据驻留在s3中的
表
执行
presto
-cli查询失败
、
、
我设置了一个Amazon EMR实例,它包含1个主和1个核心(m4 Large),具有以下版本详细信息: EMR : 5.5.0
Presto
:
Presto
0.170 Hadoop2.7.3 HDFS然后,我在
配置
单元
(create external table TABLE ... partition() stored as ORC location 's3a"//')中
创建
了
表
,并尝试
从
presto</em
浏览 7
提问于2017-06-15
得票数 1
回答已采纳
2
回答
导入
配置
单元
中的数据平面
文件
,但不定义
配置
单元
表
结构
、
、
是否可以将
CSV
或任何其他平面
文件
导入到
配置
单元
中,而无需首先在
配置
单元
中
创建
和定义
表
结构。假设我的
csv
文件
有200列,需要导入到
配置
单元
表
中。因此,我必须首先在
配置
单元
中
创建
一个
表
,并在该
配置
单元
表
和导入中定义所有列名和数据类型。有没有
浏览 0
提问于2012-09-06
得票数 5
1
回答
配置
单元
ORC上的
Presto
查询错误,
无法
从
双精度类型的ORC流中读取SQL类型real
、
、
、
我能够在
presto
中运行query来读取Hive ORC(snappy)
表
中的非浮点列。但是,当我通过
presto
cli选择所有浮点数据类型列时,会给出以下错误消息。任何建议除了在targetHive
表
中将字段类型更改为double之外,还有什么替代方法
presto
:sample> select * from emp_detail; Query hdfs://ip_addressmanaged/hive/sample.db/emp_detail
浏览 31
提问于2020-01-08
得票数 1
回答已采纳
1
回答
Presto
查询行的数组
、
、
、
因此,我有一个具有模式的
配置
单元
外部
表
,如下所示:.`z` string所以基本上我需要查询一个列(列"y"),它是嵌套的json数组,我可以
从
hive))1.该
表
是一个
配置
单元
外部
表
。2.我
使用</e
浏览 1
提问于2017-07-28
得票数 1
2
回答
使用
HDFS更改更新
配置
单元
外部
表
、
、
、
假设,我
从
文件
myFile.
csv
(位于HDFS中)
创建
了
配置
单元
外部
表
"myTable“。谢谢。我想知道它与目录的工作方式是否相同:比方说,当"myDir“包含10个
文件
时,我
从
HDFS目录"myDir”
创建</
浏览 1
提问于2013-06-10
得票数 6
回答已采纳
2
回答
加载或指向多个拼板路径,用于用蜂巢或预存储程序进行数据分析
、
、
、
、
我有几个火花作业,在AWS S3中产生拼花
文件
。每隔一段时间,我需要对这个数据的给定日期范围运行一些临时查询。我不想在火花中这样做,因为我希望我们的QA团队没有知识或火花能够做到这一点。我喜欢做的是拆分一个AWS EMR集群,并将拼板
文件
加载到HDFS中,并对其运行我的查询。我已经知道了如何用蜂巢
创建
表
,并将其指向一个s3路径。但这就限制了我的数据只有一天。我知道hive可以支持分区,但是我的s3
文件
不是这样设置的。 我还研究了,它似乎是这类数据分析最喜欢的工具。但是看起来,您不能真正地将数据加载到您的<
浏览 5
提问于2016-04-14
得票数 2
1
回答
pyspark一次读取多个
csv
文件
、
、
我正在
使用
SPARK读取hdfs中的
文件
。有一个场景,我们以
csv
格式
从
遗留系统中获取
文件
块。ID1_FILENAMEA_1.
csv
ID1_FILENAMEA_3.
csv
ID2_FILENAMEA_1.
csv
ID2_FILENAMEA_3.
csv
此
浏览 228
提问于2021-09-27
得票数 1
回答已采纳
1
回答
如何
使用
配置
单元
表
中的列在from_utc_timestamp函数中定义时区
、
、
我有一个hive
表
,其中包含一个事务utc_time_date - in UTC,时区存储为一个字符串sessionid当我
使用
FROM_UTC_TIMESTAMP(session, 'CST')时,我得到了正确的时间/日期组合。下面是
创建
这些列的代码片段 FROM_UTC_
浏览 5
提问于2016-12-17
得票数 0
2
回答
使用
presto
查询本地拼花
、
使用
火花和钻,我可以查询本地拼花
文件
。
presto
提供同样的功能吗?换句话说,是否可以
使用
presto
查询本地拼花
文件
-而不需要经过HDFS或hive?
浏览 4
提问于2016-12-07
得票数 4
回答已采纳
1
回答
如何将S3存储桶中的JSON
文件
与AWS Athena中的字段链接起来
、
、
是否可以将S3存储桶中的JSON或TXT
文件
与body列中的条目链接起来,并将其
从
Athena中提取出来? 我已经看到DynamoDB有类似这样的东西,它可以在它的条目中存储对象的引用。
浏览 3
提问于2018-11-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python初学者基础之如何读取文件格式
开源OLAP引擎综评:HAWQ、Presto、ClickHouse
【大数据】Presto(Trino)SQL 语法进阶
Smartbi V8.5如何支持异构数据的关联查询
Presto 在有赞的实践之路
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券