腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如
何在
Delta
Lake
表
中
添加
新
列
?
、
、
、
我正在尝试向Azure Blob存储
中
存储为增量表的数据
添加
新
列
。对数据执行的大多数操作都是upsert,有很多更新,很少有
新
的插入。insertAll() .updateExpr(upsertStat) .execute() 从these docs上看,
Delta
Lake
似乎只支持在insertAll()和updateAll()调用
中
添加
新
浏览 63
提问于2020-08-22
得票数 3
回答已采纳
2
回答
AWS Glue能否抓取
Delta
Lake
表
数据?
、
、
、
根据Databricks的article,将
delta
lake
与AWS Glue集成是可能的。然而,我不确定是否有可能在Databricks平台之外也这样做。是不是有人这么做了?另外,是否可以使用Glue爬虫
添加
与
Delta
Lake
相关的元数据?
浏览 16
提问于2019-10-02
得票数 8
1
回答
为
Delta
Lake
中
的
表
创建索引
、
、
我是
Delta
Lake
的新手,但我想为
Delta
Lake
中
的一些
表
创建一些索引,以便快速检索。它表明最接近的是通过创建数据跳过,然后索引跳过的部分:除了跳过数据之外,似乎找不到创建索引的其他方法 如
何在
Delta
Lake
中
像在RDBMS
中
创建
表
一样创建索引
浏览 2
提问于2019-10-24
得票数 2
1
回答
Delta
Lake
MERGE INTO语句
、
sessions.sessionId = updates.sessionIdWHEN NOT MATCHED THEN INSERT * " 我正在使用io.
delta
:
delta
-core_2.11:0.6.1,我哪里做错了?
浏览 58
提问于2020-07-15
得票数 0
回答已采纳
4
回答
没有Databricks运行时的
Delta
Lake
、
、
、
可以使用
Delta
Lake
而不依赖于Databricks Runtime吗?(我的意思是,是否可以仅在prem上使用带有hdfs和spark的
delta
-
lake
?)
浏览 10
提问于2020-03-24
得票数 5
1
回答
基于结构化流媒体作业流水线的
delta
lake
最优分区策略
、
、
在我的场景
中
,我有两个结构化的流作业,一个写到
Delta
lake
表
,第二个作业从
delta
lake
表
读取,处理它并写入另一个
表
。对于结构化流(它只需要挑选在最后一个流批次之后插入的
新
记录),我应该创建的分区的最佳选项是什么。如果我在我的
表
中使用CreatedDateTime
列
,做下一个作业,从这个
表
中
读取将使用那个分区。
浏览 3
提问于2019-09-21
得票数 0
2
回答
使用R创建数据库增量表Merge语句
、
、
、
、
我最近开始研究Databricks,并且一直在尝试找到一种方法来对
Delta
表
执行merge语句,尽管使用的是R(最好是sparklyr)。
浏览 28
提问于2021-11-23
得票数 1
3
回答
德尔塔湖
表
重复数据消除
、
、
我在Azure有一张
Delta
Lake
桌子。我使用的是Databricks。当我们
添加
新
条目时,我们使用merge into来防止重复项进入
表
中
。然而,重复项确实进入了
表
中
。我不知道这是怎么发生的。有什么方法可以检测并删除
表
中
的重复项吗?我找到的所有文档都展示了如
何在
合并之前对数据集进行重复数据删除。这一次什么也没有,副本已经在那里了。如何删除重复项? 谢谢
浏览 1
提问于2020-10-13
得票数 0
1
回答
用SymlinkTextInputFormat查询达美湖
表
、
、
、
、
问题摘要:无法通过S3
表
上的Athena查询数据。我相信,如果帐户启用了
Lake
,问题就会具体发生。 设置一个
新
的雅典娜
表
(更新下面的$bu
浏览 14
提问于2021-12-09
得票数 1
2
回答
在Azure数据库中将Spark数据存储到
delta
表
时丢失数据格式
、
、
、
、
当我试图将Spark作为
delta
表
保存到Azure Databricks
Delta
Lake
时,我的所有数据类型都会变成字符串。此外,过去是datetime类型
列
中
的所有日期都会在没有可识别模式的情况下被洗牌。 有人知道为什么会发生这种情况吗?如何预防?
浏览 6
提问于2022-06-30
得票数 1
1
回答
如
何在
mysql字段数据
表
中
插入
新
列
?
、
如
何在
mysql字段数据
表
中
插入
新
列
?例如,如果我有一个包含myfield
表
field_data_field_myfield的字段(myfield),其中包含以下列‘实体_类型’、‘实体_id’、‘修订_id’、'bundle‘、'
delta
’、‘语言’、'myfield_value‘和’myfield_format‘……我如何将
列
mynew
列
添加
为类型varchar?
浏览 0
提问于2016-04-06
得票数 1
回答已采纳
1
回答
在数据库上的
Delta
上指定列名和推断模式
、
、
我正在使用sql来处理databricks
delta
实时
表
特性。有一个选项可以为它提供一个显式模式,但鉴于这是一个着陆
表
,我希望将这种开销的负担降到最低。星火文档非常稀少,而且databricks文档甚至更糟糕。有人知道我能不能这么做吗?
浏览 4
提问于2022-05-17
得票数 1
1
回答
Delta
Lake
:
Delta
表
的下一版本如何不携带删除的记录?
、
、
、
我们每天在
delta
lake
表
(
表
名: dst1)中加载源文件作为时间序列数据。如果deltalake
表
不存在,我们将创建一个
表
。如果
表
确实存在,我们将合并
新
数据作为时间序列数据。Creating Table if table does not exist: spark.sql(f"CREATE TABLE {dtable} USING
DELTA
LOCATION {dmount1Mapple Syrup F
浏览 20
提问于2021-09-23
得票数 2
回答已采纳
1
回答
如
何在
编写蒸火花数据时指定增量表属性
、
、
、
让我们假设我有一个流数据,并且我将它写到Databricks
Delta
Lake
: .format("
delta
") .start("targetPath")spark.sql("CREATE TABLE <TBL_NAME> USING
DELTA
LOCAT
浏览 11
提问于2021-11-30
得票数 3
回答已采纳
1
回答
(Azure Data Factory)如果
列
不存在,则聚合不起作用
、
、
我正在处理这个数据流:如
何在
还不存在的列上使用聚集?因为数据流从未启动过。 我必须在一个数据流
中
做到这一点(不是一个数据流初始化
Delta
Lake
,另一个数据流插入
新
行)。
浏览 3
提问于2021-10-14
得票数 0
1
回答
如
何在
databricks
中
现有的增量表
中
添加
自动增量
列
、
、
、
在Databricks
中
,我有一个现有的
delta
表
,我希望在其中再
添加
一个
列
,作为Id,这样每一行都有唯一的id no,并且是连续的(主键在sql
中
的存在方式)。到目前为止,我已经尝试将
delta
表
转换为,并将
新
列
添加
为from pyspark.sql import functionswithColumn(&q
浏览 5
提问于2022-07-12
得票数 0
2
回答
根据硬编码值拆分列的SQL查询
、
、
我有一张桌子(
如
假定这个装置)我可以定义硬编码的类别,我不确定如
何在
sql中表示这一点。Categoy1 = "alpha, bravo,
delta
, gamma'
浏览 4
提问于2013-02-05
得票数 0
回答已采纳
1
回答
如
何在
Delta
Lake
中
删除旧版本的
表
、
正如我从文档中了解到的,
delta
允许回滚,或者
如
他们所说的那样,可以回滚到某个特定版本的
表
。但是,我如何确保删除数据会在不创建新版本的情况下将其删除?
浏览 38
提问于2019-10-01
得票数 2
回答已采纳
1
回答
如何将Tableau/BI工具连接到
Delta
Lake
?(没有databricks)
、
、
、
我正在努力弄清楚的一件事是如
何在
spark会议之外连接到
Delta
Lake
(银牌和金牌)
表
。我希望能够使用像Tableau这样的BI工具连接到这些
表
。我没有使用databricks,我想知道将这些
表
存储在hive metastore
中
是否会有所帮助。如果不是这样,那么是否有人可以帮助我与其他方法或如果这是可行的或不可行的。
浏览 61
提问于2021-04-04
得票数 2
3
回答
如
何在
Databricks
中
重命名列
、
如
何在
Databricks
中
重命名列?以下内容不起作用:它返回错误: 如果有差异的话,这个
表
使用的是<em
浏览 6
提问于2019-12-26
得票数 12
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度对比Apache CarbonData、Hudi和Open Delta三大开源数据湖方案
作业帮湖仓一体最佳实践
如何在Apollo代码中添加一个新的参考车辆
微软在其 Windows Insider 程序中添加了一个新的测试渠道,如 Canary
Delta Lake,让你从复杂的Lambda架构中解放出来
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券