腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
7
回答
Hadoop Vs
数据
湖
、
、
我听说了
数据
湖
这个新名词。我在谷歌上查到了
数据
湖
是一个大规模的存储库和处理引擎.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖
通常与面向Hadoop的对象存储相关联。在这种情况下,组织的
数据
首先加载到Hadoop平台,然后将业务分析和
数据
挖掘工具应用于其驻留在Hadoop的商品计算机集群节点上的
数据
。我对Hadoop和
数据
<
浏览 8
提问于2016-03-14
得票数 16
2
回答
从一个DataLake到另一个DataLake的Azure
数据
工厂复制
、
我需要建立一个能够从一个DataLake复制到另一个的管道,但是到目前为止,通过谷歌搜索,我找不到任何与之相关的东西,有人能给我指出正确的方向吗?非常感谢。
浏览 16
提问于2018-02-21
得票数 0
1
回答
如何使用用户分配的标识从
数据
库访问ADLS容器
、
、
、
我已经成功地在Databricks中挂载了带有服务主体的ADLS,并且能够对
数据
进行必要的转换。 现在,我正在使用用户分配的托管身份来避免在代码中保留秘密。
浏览 6
提问于2022-03-08
得票数 0
2
回答
如果我删除Azure
数据
湖
分析帐户,它会删除它的默认
数据
源吗?
、
我对Azure相当陌生,我只是尝试Azure
数据
湖
分析。为了测试目的,我创建了一个新的Azure帐户,并且希望现在就删除它,但是在安装过程中,我使用了一个现有的Azure
数据
湖
存储(ADLS)帐户作为默认的存储帐户。我现在知道我可能应该添加现有的ADLS作为关联的
数据
存储。
浏览 3
提问于2017-08-18
得票数 0
1
回答
将Azure应用程序Insight日志文件导出到Azure
数据
湖
存储
、
、
我可以通过azure应用程序洞察力跟踪我的应用程序日志文件,并导出xls工作表( ),但是为了备份跟踪目的,我需要将所有日志文件存储到蔚蓝
数据
湖
存储中。我需要在我的应用程序上调试这个问题,当我面对issues.but时,我得到了和继续导出sql,blob存储的链接,我不想要不必要的存储来将我的
数据
存储在蔚蓝资源中。因此,如果有任何方式连接应用程序洞察力到Azure
数据
湖
通过连接器或plugins.IF,its,请您分享我的链接。 谢谢。。
浏览 2
提问于2017-05-30
得票数 5
1
回答
数据
湖
如何存储
数据
和格式?
、
、
、
、
我听说
数据
湖
可以存储任何类型的
数据
:关系型,NoSql,图片/图像,Adobe,Excel。如何以无SQL格式或二叉树存储
数据
?还是把它像普通硬盘一样保存?如果是这样的话,他们为什么不直接称之为存储,而不是
数据
湖
呢?我正在试图找到“
数据
湖
”的确切存储机制。
浏览 0
提问于2018-09-09
得票数 2
回答已采纳
1
回答
数据
存档与
数据
摄入
、
从大
数据
或
数据
湖
的角度来看,
数据
归档和
数据
摄入到底有什么区别?我推测,在
数据
湖
的上下文中,“摄入”是一个恰当的词,但是如果我们在那里使用'Archival‘而不是’摄入‘,那么我们所缺少的是什么。我认为使用“摄入”而不是“归档”的几个原因是 谢谢
浏览 1
提问于2018-09-28
得票数 0
2
回答
从
数据
湖
中检索
数据
到分析系统
、
、
我们在Hadoop文件系统中创建了一个新的
数据
湖
。
数据
以ORC的形式存储。目前分析系统直接连接到
数据
湖
来读取这些ORC文件。 有没有办法在
数据
湖
和分析系统之间创建一个中间层来服务
数据
?
浏览 16
提问于2018-10-04
得票数 0
2
回答
如何处理
数据
湖
vs
数据
仓库中的历史化
数据
?
、
在传统
数据
仓库中实现
数据
历史化是可能的(甚至是核心功能)。随着时间的推移,
数据
将被添加到
数据
仓库中,并且可以在
数据
中及时移动。 如果我只想使用
数据
湖
,并为业务用户提供
数据
历史化,这可能吗?
浏览 36
提问于2020-11-30
得票数 0
回答已采纳
1
回答
Kappa体系结构是否使用
数据
湖
?
、
、
、
、
Kukreja在“Apache、Delta
湖
和Lakehouse的
数据
工程”中说,Kappa体系结构没有
数据
湖
。微软在 (见图)中提到了一家“长期商店”,但没有透露它的实际情况。它使用这些
数据
来“重新计算”。对我来说,这是一个
数据
湖
。
浏览 10
提问于2022-07-21
得票数 0
回答已采纳
1
回答
如果我通过enduser/承租者分割我的微服务
数据
,并且每个服务器都拥有全部
数据
的一个子集,那么如何在所有服务器上查询
数据
呢?
、
、
设想一个高度可伸缩的体系结构,其中每个租户都是按区域和可用性区域划分和分布的,每个服务器都持有总
数据
的一个子集。还存在冗余,还有承载相同逻辑碎片的物理碎片。这很好,如果客户端知道分配给用户的所有逻辑碎片,那么在处理返回极端数量
数据
的请求时,客户端可以使用map/reduce样式检索所有
数据
。这解决了当用户的
数据
量大于任何单个服务器的存储、内存或计算的容量时的问题。那么我的问题是,如果一个名词微服务的
数据
是跨多个服务器隔离和共享的,并且每个服务器都承载着不同的用户或租户子集,我如何创建系统中所有对
浏览 4
提问于2022-07-23
得票数 0
1
回答
是否跟踪
数据
池中
数据
的更改?
、
、
最近我发现了
数据
湖
世界,我计划用ADL建立一个
数据
湖
。我不确定的一件事是
数据
湖
应该如何跟踪随时间变化/处理与源不同版本的更改。我遇到过这样的站点,声称
数据
湖
按原样提供
数据
,其他状态是
数据
应该是时间戳,或者文件夹结构应该反映时间戳。干杯!
浏览 0
提问于2019-07-24
得票数 0
回答已采纳
1
回答
如何从Azure
数据
湖
转换,将
数据
按日期文件夹分区到delta
湖
、
、
、
我拥有一个由datetime嵌套文件夹划分
数据
的蔚蓝
数据
湖
gen2。我想向我的团队提供增量
湖
格式,但是我不确定我是否应该创建一个新的存储帐户,将
数据
复制成增量格式,或者将当前的蔚蓝
数据
湖
转换为增量
湖
格式是否是最佳实践。 有人能提供关于这件事的任何建议吗?
浏览 2
提问于2022-08-09
得票数 0
回答已采纳
2
回答
如何使用
数据
工厂截断Dynamics 365实体(并复制到Azure
数据
湖
)?
、
、
、
、
我目前正在使用
数据
工厂将实体从Dynamics 365批量复制到Azure
数据
湖
。实体每24小时保存为
数据
湖
中的CSV文件。我希望将实体截断为新
数据
,并附加到
数据
湖
中已经存在的文件中,而不是批量复制。 我认为这是SQL
数据
库的常见操作,但这可以在Dynamics 365和
数据
湖
之间完成吗?
浏览 14
提问于2019-05-01
得票数 1
2
回答
关于三角洲
湖
的困惑
据我所知,它为您的
数据
存储增加了ACID事务,并通过增量引擎提高了查询性能。如果是这样,为什么我们还需要其他不支持ACID事务的
数据
湖
呢?Delta lakes声称将
数据
湖
和
数据
仓库这两个世界结合在一起,我们知道,由于它目前对操作的支持,它还不能取代传统的
数据
仓库。但它应该取代
数据
湖
吗?为什么需要两份
数据
副本-一份在
数据
湖
中,另一份在德尔塔
湖
中?
浏览 21
提问于2020-07-30
得票数 0
回答已采纳
1
回答
能否在Azure database中创建链接服务到Synapse
数据
库
、
嗨,有人能让我知道是否有可能在Azure
数据
工厂中创建链接到湖泊
数据
库的服务吗?
浏览 2
提问于2022-06-20
得票数 0
回答已采纳
2
回答
数据
湖
中的
数据
保留策略
我是这个Azure
数据
湖
世界的新手。我正在寻找任何必要的先决条件和注意事项,以便使用蔚蓝
数据
湖
.我找到了一个很好的链接,并发现安静有用。因此,在任何
数据
湖
中,对于
数据
保留策略(归档、清除),我们是否需要遵循特定和基本的考虑?
浏览 1
提问于2017-02-19
得票数 2
回答已采纳
2
回答
在我的用例中需要
数据
吗?
我的web应用程序存储使用
数据
,例如:执行的任务等等,我需要显示仪表板和报告的使用和性能趋势,例如:平均任务执行时间是多少?
数据
来自具有特定
数据
模型的关系
数据
库。 有人要求我创建一个
数据
记录,只是给他我所有的原始
数据
。我不明白这张照片里有什么
数据
。没有模型和关系,我的
数据
是无用的。而且,我没有事件流:我在关系
数据
库中有表。例如,“任务”表中的一行将有“打开时间”列和
浏览 0
提问于2018-11-04
得票数 1
1
回答
Azure
数据
工厂和
数据
库之间的连接
、
、
、
我想知道从Azure
数据
工厂访问databricks最合适的方式是什么。 目前,我已经将databricks作为一个链接服务,我通过一个生成的令牌来访问它。
浏览 0
提问于2019-11-01
得票数 0
2
回答
使用
数据
湖
分析复制
数据
- U-SQL
、
、
我需要从ADLS(Azure
数据
湖
存储)源复制到接收器ADLS,但只复制最新的文件。每小时,到达源的一个.csv文件,这个文件必须被复制到宿
数据
湖
。任务:复制file_01.csv以接收
数据
湖
。event: Hour2 - file_02.csv到达源。任务:复制file_02.csv以接收
数据
湖
。诸若此类。选择最新的文件,并将该文件复制到接收器
数据
湖
中。如何使用u-sql声明包含日期和时间的变量?如何使用u-sql
浏览 2
提问于2018-04-23
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
徐州市大数据管理局正式成立
数据湖与大数据?
徐州市贾汪区大数据治理农村微腐败
什么是数据湖?
视频数据湖?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券