腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
7
回答
Hadoop Vs
数据
湖
、
、
我听说了
数据
湖
这个新名词。我在谷歌上查到了
数据
湖
是一个大规模的存储库和处理引擎.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖
通常与面向Hadoop的对象存储相关联。在这种情况下,组织的
数据
首先加载到Hadoop平台,然后将业务分析和
数据
挖掘工具应用于其驻留在Hadoop的商品计算机集群节点上的
数据
。我对Hadoop和
数据
<
浏览 8
提问于2016-03-14
得票数 16
2
回答
从
数据
湖
中检索
数据
到分析系统
、
、
我们在Hadoop文件系统中创建了一个新的
数据
湖
。
数据
以ORC的形式存储。目前分析系统直接连接到
数据
湖
来读取这些ORC文件。 有没有办法在
数据
湖
和分析系统之间创建一个中间层来服务
数据
?
浏览 16
提问于2018-10-04
得票数 0
2
回答
如何处理
数据
湖
vs
数据
仓库中的历史化
数据
?
、
在传统
数据
仓库中实现
数据
历史化是可能的(甚至是核心功能)。随着时间的推移,
数据
将被添加到
数据
仓库中,并且可以在
数据
中及时移动。 如果我只想使用
数据
湖
,并为业务用户提供
数据
历史化,这可能吗?
浏览 36
提问于2020-11-30
得票数 0
回答已采纳
2
回答
从头开始建
数据
湖
、
、
我正试图从零开始
构建
一个“
数据
湖
”。我理解
数据
湖
是如何工作的,以及它的用途;它遍布互联网。但是,当问题出现时,如何从头开始建立一个,就没有来源了。我想知道如果: 我知道如何运行Hadoop并将
数据
导入Hadoop。我想在前提
数据
湖上建立一个示例来演示我的经理。任何帮助都是非常感谢的。
浏览 1
提问于2019-02-27
得票数 2
回答已采纳
1
回答
在AWS中,具有HDFS或S3的
数据
池之间有什么区别?
、
、
、
我需要在AWS上
构建
一个
数据
湖
,但是我不知道S3和HDFS到底有什么不同。我在网上找到了一些答案,但我仍然不明白真正的区别。 我还需要知道是否有人在AWS中拥有HDFS和S3的
数据
湖
架构。
浏览 2
提问于2019-07-11
得票数 1
回答已采纳
1
回答
如何
构建
代表Azure的
数据
湖
(gen 2)的Docker镜像?
、
、
、
/tests/.my_test_env 如何
构建
Docker镜像来模拟Azure
数据
湖
(第2代)?我使用Python3SDK与
数据
湖
进行交互,文档在这里-- 。
浏览 3
提问于2020-08-27
得票数 2
1
回答
注册源选项中缺少的Azure权限源(SAP、HIVE、S3、“多源”)
、
希望在订阅/帐户中注册所有
数据
源,但是缺少"Azure (多个源)“选项。其他来源(HIVE、SAP、AWS S3)也是如此。
浏览 2
提问于2021-01-19
得票数 1
回答已采纳
2
回答
天蓝色水滴存储与天蓝色
数据
湖
存储的区别
、
对于像我这样的用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝
数据
湖
存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝
数据
湖
存储更适合,反之亦然? 谢谢。
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
2
回答
从一个DataLake到另一个DataLake的Azure
数据
工厂复制
、
我需要建立一个能够从一个DataLake复制到另一个的管道,但是到目前为止,通过谷歌搜索,我找不到任何与之相关的东西,有人能给我指出正确的方向吗?非常感谢。
浏览 16
提问于2018-02-21
得票数 0
1
回答
与CTAS相比,创建外部表的利弊是什么?
、
、
、
、
我正在尝试
构建
一个Azure Data管道,它从Azure
数据
湖
中获取
数据
并对其进行转换。 在我看来,这其中的权衡并不明显。
浏览 0
提问于2019-04-17
得票数 1
回答已采纳
1
回答
如何使用用户分配的标识从
数据
库访问ADLS容器
、
、
、
我已经成功地在Databricks中挂载了带有服务主体的ADLS,并且能够对
数据
进行必要的转换。 现在,我正在使用用户分配的托管身份来避免在代码中保留秘密。
浏览 6
提问于2022-03-08
得票数 0
1
回答
Azure Data factory中是否有任何选项可在从源系统复制
数据
时保留相同的日期格式
我正在使用Azure
数据
工厂复制活动将
数据
从Oracle Table复制到Azure data Lake。 只要我的日期格式是DD-MM-YYYY,azure就会把它们转换成DATE_TIME格式。
浏览 18
提问于2019-09-04
得票数 0
回答已采纳
1
回答
使用Kimball的星型模式和
数据
集市的
数据
湖
、
、
、
、
目标 更具体地说,在我的例子中: 2-3) A
浏览 0
提问于2020-09-15
得票数 1
回答已采纳
1
回答
这是验证Azure服务的正确和完整的身份验证方法列表吗?
、
、
、
我使用Azure来
构建
我的Java项目。我需要认证一些Azure服务如下: 我在上找到了一个简短的文档,
浏览 2
提问于2021-01-14
得票数 0
回答已采纳
2
回答
如果我删除Azure
数据
湖
分析帐户,它会删除它的默认
数据
源吗?
、
我对Azure相当陌生,我只是尝试Azure
数据
湖
分析。为了测试目的,我创建了一个新的Azure帐户,并且希望现在就删除它,但是在安装过程中,我使用了一个现有的Azure
数据
湖
存储(ADLS)帐户作为默认的存储帐户。我现在知道我可能应该添加现有的ADLS作为关联的
数据
存储。
浏览 3
提问于2017-08-18
得票数 0
1
回答
如何在Apache beam中读取带有起始日期的pubsub消息
、
、
、
我有一个简单的工作,从pubsub读取历史
数据
与日期限制例如,我想读取消息从日期2020-04-10到2020-04-20,然后将消息保存在google存储桶中的单个文件中的每一天
浏览 4
提问于2020-06-10
得票数 0
1
回答
将Azure应用程序Insight日志文件导出到Azure
数据
湖
存储
、
、
我可以通过azure应用程序洞察力跟踪我的应用程序日志文件,并导出xls工作表( ),但是为了备份跟踪目的,我需要将所有日志文件存储到蔚蓝
数据
湖
存储中。我需要在我的应用程序上调试这个问题,当我面对issues.but时,我得到了和继续导出sql,blob存储的链接,我不想要不必要的存储来将我的
数据
存储在蔚蓝资源中。因此,如果有任何方式连接应用程序洞察力到Azure
数据
湖
通过连接器或plugins.IF,its,请您分享我的链接。 谢谢。。
浏览 2
提问于2017-05-30
得票数 5
1
回答
数据
湖
如何存储
数据
和格式?
、
、
、
、
我听说
数据
湖
可以存储任何类型的
数据
:关系型,NoSql,图片/图像,Adobe,Excel。如何以无SQL格式或二叉树存储
数据
?还是把它像普通硬盘一样保存?如果是这样的话,他们为什么不直接称之为存储,而不是
数据
湖
呢?我正在试图找到“
数据
湖
”的确切存储机制。
浏览 0
提问于2018-09-09
得票数 2
回答已采纳
1
回答
数据
存档与
数据
摄入
、
从大
数据
或
数据
湖
的角度来看,
数据
归档和
数据
摄入到底有什么区别?我推测,在
数据
湖
的上下文中,“摄入”是一个恰当的词,但是如果我们在那里使用'Archival‘而不是’摄入‘,那么我们所缺少的是什么。我认为使用“摄入”而不是“归档”的几个原因是 谢谢
浏览 1
提问于2018-09-28
得票数 0
2
回答
搜索存储在Azure
数据
湖
中的
数据
、
、
、
、
我有以下
构建
数据
湖
的用例(例如在Azure中): 我的组织处理濒临破产的公司。一旦一家公司破产,它需要把他们所有的
数据
交给我们,包括结构化
数据
(例如CSV)以及半结构化和非结构化
数据
(例如PDF、Word文档、图像、JSON、.txt文件等)。在这里拥有一个
数据
湖
会有所帮助,因为
数据
量可能很大,而且不可预测,Azure data看起来是一个相对低成本和可伸缩的存储解决方案。然而,除了存储所有这些
数据
之外,我们还需要为
浏览 1
提问于2020-01-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
企业级数据湖构建探索
精品PPT | “数据湖”构建汽车集团数据中台
数据湖与大数据?
Uber使用Apache Hudi构建了一个大规模事务型数据湖
什么是数据湖?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券