腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(7955)
视频
沙龙
1
回答
针对
结构
值
的
Spark
-
Hive
集成
-
空
输出
、
、
使用
Spark
2.2 我已经从
spark
程序中填充了一个拼图
结构
列,也填充了另一个拼图列
结构
数组 当它将其作为外部表从配置单元读取时;
结构
数组已正确填充,但
结构
(非数组类型)字段生成为NULL。注意:在拼图中,同时填充了struct和struct数组
值
。只有在蜂巢里我们才有问题,对此有什么想法吗?
浏览 7
提问于2020-01-18
得票数 0
2
回答
从表中动态获取
空
列计数
、
、
我使用datastax +
spark
集成
和
spark
SQL节俭服务器,这为我提供了一个
Hive
SQL接口来查询Cassandra中
的
表。我
的
数据库中
的
表是动态创建
的
,我想要做
的
是根据表名在表
的
每一列中获取
空
值
的
计数。我可以使用describe database.table获取列名,但是在
hive
中,如何在另一个select查询中使用它<em
浏览 7
提问于2017-06-16
得票数 8
1
回答
Spark
作为执行引擎还是
spark
作为应用程序?
、
、
、
、
使用
spark
作为
hive
上
的
执行引擎还是使用
spark
SQL访问
hive
表,哪个更好?为什么?
浏览 0
提问于2020-06-13
得票数 0
1
回答
Spark
SQL返回所有空
值
,而直接蜂巢工作和通过火花工程
的
直接Parquet返回
、
、
在
Hive
中定义
的
外部表
Spark
出现了一个奇怪
的
问题 CREATE EXTERNAL TABLE ... STORED AS PARQUET...")引用
Spark
中
的
表,就会得到正确
的
行计数,但是每个
值
都是
空
的
。当我通过Beeline查询表时,我得到了正确
的
值
。此外,如果我使用
spark
.read.parquet("hdfs:/&
浏览 1
提问于2021-02-09
得票数 0
3
回答
如何将火花
结构
流DataFrame插入到
Hive
外部表/位置?
、
、
一个关于星火
结构
流与
HIVE
表
集成
的
查询。 val
spark
=SparkSession.builder().appName("StatsAnalyzer") .config("
hive
.exec.dynamic.partition", "true")
浏览 0
提问于2018-12-28
得票数 13
2
回答
Spark
2.3.1 AWS EMR没有返回某些列
的
数据,但在雅典娜/Presto和频谱中工作
、
上表中每一行
的
每个
值
都返回空。数据存储在拼板中。。没有区别,尽管有些列不是null,但每一个列
的
值
都是
空
的
。该列是作为最后一列添加到表中
的
,因此大多数数据确实为
空
,但有些行不为
空
。该列最后列在目录中
的</e
浏览 1
提问于2018-09-13
得票数 4
回答已采纳
1
回答
使用Pyspark
的
HIVE
JDBC连接将列名作为行
值
返回。
、
、
、
、
问题是,它返回所有具有列名
值
的
行。它正在返回正确
的
列名。只有行
值
不正确。这是我
的
密码 .appName("Python
Spark
SQL
Hive
integration
浏览 20
提问于2020-12-17
得票数 0
1
回答
火花公子不能到达蜂巢
、
、
、
spark
.catalog.listDatabases()只显示默认
值
,任何查询运行都不会显示在我
的
母版日志中。()) 数据库(名称=u‘’default‘,description=u’‘default’,locationUri=u'hdfs://HdfsNameService/apps不管我是否将它设置为我在蜂巢站点中找到
的
值
、
浏览 0
提问于2018-12-19
得票数 0
回答已采纳
1
回答
Spark
Countbykey() -为什么作为动作实现
、
、
在
Spark
中,为什么CountbyKey()是作为动作而不是转换来实现
的
。我认为它
的
功能类似于Reducebykey或combinebykey。有没有什么特别的原因让它实现为Action..
浏览 1
提问于2019-04-12
得票数 2
2
回答
Databricks Delta和
Hive
事务表
、
、
、
我从两个来源看到,现在你不能以任何有意义
的
方式与
Spark
的
HIVE
事务表进行交互。 我看到Databricks发布了一个名为
的
事务性功能。现在可以使用此功能读取配置单元事务性表吗?
浏览 0
提问于2018-12-13
得票数 2
2
回答
星火SQL抛出错误"java.lang.UnsupportedOperationException:未知字段类型:
空
“
、
、
、
当创建一个列
值
默认
值
为NULL
的
表时,我在
Spark
(1.6) SQL中获得了下面的错误。示例:将表测试创建为select column_a,NULL作为column_b从test_temp创建; a
浏览 3
提问于2017-12-27
得票数 0
回答已采纳
2
回答
Apache不使用来自
Hive
分区外部表
的
分区信息
、
、
我有一个简单
的
Hive
外部表,它是在S3之上创建
的
(文件是CSV格式
的
)。当我运行
hive
查询时,它会显示所有记录和分区。但是,当我在
Spark
中使用相同
的
表时(
Spark
在分区列上有一个where条件),它不会显示应用了分区筛选器。然而,对于
Hive
托管表,
Spark
可以使用分区信息并应用分区筛选器。是否有任何标志或设置可以帮助我使用星火中
的
Hive
外部表
的
分
浏览 0
提问于2019-08-24
得票数 3
2
回答
通过sparkSQL创建蜂窝
、
、
、
我对蜂巢中
的
扣环有一个疑问。我已经创建了一个临时表,该表在列关键字上存储桶。当我检查这个表
的
基目录时,它显示了前缀为part_*
的
文件名。但是,当我通过另一个表手动将数据插入到这个表中时,我看到了以00000_*为前缀
的
文件。有人能帮帮忙吗。 谢谢,
浏览 1
提问于2018-08-02
得票数 5
2
回答
配置单元“alter table <table name> concatenate”是如何工作
的
?
、
、
、
我有n(large)数量
的
小尺寸
的
orc文件,我想合并成k(small)数量
的
大
的
orc文件。任何指针都会很棒。
浏览 36
提问于2017-01-24
得票数 3
1
回答
Spark
JDBC with
HIVE
- Scala
、
、
、
我在
HIVE
中有一个示例表(Stuends1),我想使用JDBC从
Spark
连接它(因为
Hive
在AWS中,而不是在同一个集群中)。().foreach(println)sqlDF.show(false)我尝试了多种方法,但总是只显示列名称
的
表
结构
。在
spark
中,jdbcDF.printSchema()也显示了正确
的
模式,所以我猜连接没有问题。 我使用
的
是
sp
浏览 25
提问于2017-08-24
得票数 3
1
回答
pyspark使用
spark
.sql.rdd.foreach()修改类属性
、
主要任务是连接
Hive
并使用
spark
rdd读取数据。 我已经尝试了下面的代码。连接和读取都成功,但是当我想修改self.jobUserProfile
的
值
时,我失败了。然后我将这个
值
打印在三个位置(在#1,#2和#3中进行掩蔽)。在第一个位置,
值
是有效
的
,但是在第二个和第三个位置,dict是
空
的
。似乎修改还没有分配到class属性中。我尝试过response =
spark
.sql('select use
浏览 9
提问于2020-10-28
得票数 0
2
回答
当列计数不为0时,“拼图记录格式不正确”
、
、
、
(DataWritableWriter.java:64) at org.apache.hadoop.
hive
.ql.io.parquet.write.DataWritableWriteSupport.write(ParquetRecordWriterWrapper.java:124) at org.apache.<e
浏览 93
提问于2020-01-10
得票数 5
2
回答
为事务启用
的
配置单元存储区表
、
、
、
因此,我们尝试使用以下语句创建一个ORC格式
的
Hive
表,并为事务设置存储桶并启用该表该表是在
Hive
中创建
的
,并且还反映在Metastore和
Spark
SQL(我们已配置为在
Hive
浏览 1
提问于2015-11-23
得票数 2
2
回答
\tmp\
hive
在
Spark
SQL中
的
作用是什么(特别是同时使用winutils.exe进行设置)?
、
、
、
这是Windows上
的
Apache
Spark
。 使用winutils.exe修改权限时,\tmp\
hive
有什么需求?我可以将此路径更改为随机临时目录吗?
浏览 0
提问于2018-03-07
得票数 1
2
回答
Spark
-
Hive
表在shell上返回空
值
、
我正在尝试使用
spark
.sql(“")在
spark
shell上拉取
hive
表数据,但它给出了
空
值
。配置单元表包含数据。即使我已经使用HiveContext对象编写了代码,但仍然存在相同
的
问题。
浏览 14
提问于2019-05-22
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
教程:Apache Spark SQL入门及实践指南!
年薪50万+的大数据工程师需要具备哪些技能?
看SparkSQL如何支撑企业级数仓
如何将外部数据源与Spark集成?
全面解析大数据框架Hadoop主要模块
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券