腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
7
回答
Hadoop Vs
数据
湖
、
、
我听说了
数据
湖
这个新名词。我在谷歌上查到了
数据
湖
是一个大规模
的
存储库和处理引擎.
数据
池提供“任何类型
的
数据
的
大量存储、巨大
的
处理能力和处理几乎无限并发任务或作业
的
能力”。术语
数据
湖
通常与面向Hadoop
的
对象存储相关联。在这种情况下,组织
的
数据
首先加载到Hadoop平台,然后将业务分析和
数据</em
浏览 8
提问于2016-03-14
得票数 16
2
回答
从
数据
湖
中检索
数据
到分析系统
、
、
我们在Hadoop文件系统中创建了一个新
的
数据
湖
。
数据
以ORC
的
形式存储。目前分析系统直接连接到
数据
湖
来读取这些ORC文件。 有没有办法在
数据
湖
和分析系统之间创建一个中间层来服务
数据
?
浏览 16
提问于2018-10-04
得票数 0
2
回答
如何处理
数据
湖
vs
数据
仓库中
的
历史化
数据
?
、
在传统
数据
仓库中实现
数据
历史化是可能
的
(甚至是核心功能)。随着时间
的
推移,
数据
将被添加到
数据
仓库中,并且可以在
数据
中及时移动。 如果我只想使用
数据
湖
,并为业务用户提供
数据
历史化,这可能吗?如果是,一个可能
的
方法是什么样子
的
?
浏览 36
提问于2020-11-30
得票数 0
回答已采纳
2
回答
从头开始建
数据
湖
、
、
我正试图从零开始
构建
一个“
数据
湖
”。我理解
数据
湖
是如何工作
的
,以及它
的
用途;它遍布互联网。但是,当问题出现时,如何从头开始建立一个,就没有来源了。我想知道如果: 我知道如何运行Hadoop并将
数据
导入Hadoop。我想在前提
数据
湖上建立一个示例来演示我
的
经理。任何帮助都是非常感谢
的
。
浏览 1
提问于2019-02-27
得票数 2
回答已采纳
1
回答
在AWS中,具有HDFS或S3
的
数据
池之间有什么区别?
、
、
、
我需要在AWS上
构建
一个
数据
湖
,但是我不知道S3和HDFS到底有什么不同。我在网上找到了一些答案,但我仍然不明白真正
的
区别。 我还需要知道是否有人在AWS中拥有HDFS和S3
的
数据
湖
架构。
浏览 2
提问于2019-07-11
得票数 1
回答已采纳
1
回答
如何
构建
代表Azure
的
数据
湖
(gen 2)
的
Docker镜像?
、
、
、
/tests/.my_test_env 如何
构建
Docker镜像来模拟Azure
数据
湖
(第2代)?我使用Python3SDK与
数据
湖
进行交互,文档在这里-- 。
浏览 3
提问于2020-08-27
得票数 2
1
回答
注册源选项中缺少
的
Azure权限源(SAP、HIVE、S3、“多源”)
、
希望在订阅/帐户中注册所有
数据
源,但是缺少"Azure (多个源)“选项。其他来源(HIVE、SAP、AWS S3)也是如此。
浏览 2
提问于2021-01-19
得票数 1
回答已采纳
2
回答
天蓝色水滴存储与天蓝色
数据
湖
存储
的
区别
、
对于像我这样
的
用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝
数据
湖
存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝
数据
湖
存储更适合,反之亦然? 谢谢。
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
2
回答
从一个DataLake到另一个DataLake
的
Azure
数据
工厂复制
、
我需要建立一个能够从一个DataLake复制到另一个
的
管道,但是到目前为止,通过谷歌搜索,我找不到任何与之相关
的
东西,有人能给我指出正确
的
方向吗?非常感谢。
浏览 16
提问于2018-02-21
得票数 0
1
回答
与CTAS相比,创建外部表
的
利弊是什么?
、
、
、
、
我正在尝试
构建
一个Azure Data管道,它从Azure
数据
湖
中获取
数据
并对其进行转换。 在我看来,这其中
的
权衡并不明显。但第二个选
浏览 0
提问于2019-04-17
得票数 1
回答已采纳
1
回答
如何使用用户分配
的
标识从
数据
库访问ADLS容器
、
、
、
我有一个带有blob容器
的
ADLS存储帐户。我已经成功地在Databricks中挂载了带有服务主体
的
ADLS,并且能够对
数据
进行必要
的
转换。请提出一个工作解决方案或任何有益<
浏览 6
提问于2022-03-08
得票数 0
1
回答
Azure Data factory中是否有任何选项可在从源系统复制
数据
时保留相同
的
日期格式
我正在使用Azure
数据
工厂复制活动将
数据
从Oracle Table复制到Azure data Lake。 只要我
的
日期格式是DD-MM-YYYY,azure就会把它们转换成DATE_TIME格式。有没有办法保留与源文件相同
的
格式 如果复制活动是针对单个表
的
,我可以对特定列
的
格式进行硬编码。在我
的
场景中,我尝试使用相同
的
复制活动复制多个表,因此无法更新模式
浏览 18
提问于2019-09-04
得票数 0
回答已采纳
1
回答
使用Kimball
的
星型模式和
数据
集市
的
数据
湖
、
、
、
、
目标问题
浏览 0
提问于2020-09-15
得票数 1
回答已采纳
2
回答
如果我删除Azure
数据
湖
分析帐户,它会删除它
的
默认
数据
源吗?
、
我对Azure相当陌生,我只是尝试Azure
数据
湖
分析。为了测试目的,我创建了一个新
的
Azure帐户,并且希望现在就删除它,但是在安装过程中,我使用了一个现有的Azure
数据
湖
存储(ADLS)帐户作为默认
的
存储帐户。我现在知道我可能应该添加现有的ADLS作为关联
的
数据
存储。我假设我现在可以安全地删除Azure帐户,而不会影响底层
的
默认存储帐户,但我想在执行此操作之前检查一下,因为如果删除现有的ADLS,将是一个巨大
的
浏览 3
提问于2017-08-18
得票数 0
1
回答
这是验证Azure服务
的
正确和完整
的
身份验证方法列表吗?
、
、
、
我使用Azure来
构建
我
的
Java项目。我需要认证一些Azure服务如下: 请给我建议,非常感谢!
浏览 2
提问于2021-01-14
得票数 0
回答已采纳
1
回答
如何在Apache beam中读取带有起始日期
的
pubsub消息
、
、
、
我有一个简单
的
工作,从pubsub读取历史
数据
与日期限制例如,我想读取消息从日期2020-04-10到2020-04-20,然后将消息保存在google存储桶中
的
单个文件中
的
每一天
浏览 4
提问于2020-06-10
得票数 0
1
回答
将Azure应用程序Insight日志文件导出到Azure
数据
湖
存储
、
、
我是天蓝色门户
的
初学者,我在前端侧(角2)和后端侧(Asp.net核心)配置了azure应用程序洞察力。我可以通过azure应用程序洞察力跟踪我
的
应用程序日志文件,并导出xls工作表( ),但是为了备份跟踪目的,我需要将所有日志文件存储到蔚蓝
数据
湖
存储中。我需要在我
的
应用程序上调试这个问题,当我面对issues.but时,我得到了和继续导出sql,blob存储
的
链接,我不想要不必要
的
存储来将我
的
数据
存储在蔚蓝资源中。因此,如果有任何
浏览 2
提问于2017-05-30
得票数 5
1
回答
数据
湖
如何存储
数据
和格式?
、
、
、
、
我听说
数据
湖
可以存储任何类型
的
数据
:关系型,NoSql,图片/图像,Adobe,Excel。如何以无SQL格式或二叉树存储
数据
?还是把它像普通硬盘一样保存?如果是这样的话,他们为什么不直接称之为存储,而不是
数据
湖
呢?我正在试图找到“
数据
湖
”的确切存储机制。
浏览 0
提问于2018-09-09
得票数 2
回答已采纳
2
回答
搜索存储在Azure
数据
湖
中
的
数据
、
、
、
、
我有以下
构建
数据
湖
的
用例(例如在Azure中): 我
的
组织处理濒临破产
的
公司。一旦一家公司破产,它需要把他们所有的
数据
交给我们,包括结构化
数据
(例如CSV)以及半结构化和非结构化
数据
(例如PDF、Word文档、图像、JSON、.txt文件等)。在这里拥有一个
数据
湖
会有所帮助,因为
数据
量可能很大,而且不可预测,Azure data看起来是一个相对低成本和可伸缩
的
存储
浏览 1
提问于2020-01-07
得票数 0
1
回答
数据
存档与
数据
摄入
、
从大
数据
或
数据
湖
的
角度来看,
数据
归档和
数据
摄入到底有什么区别?我推测,在
数据
湖
的
上下文中,“摄入”是一个恰当
的
词,但是如果我们在那里使用'Archival‘而不是’摄入‘,那么我们所缺少
的
是什么。我认为使用“摄入”而不是“归档”
的
几个原因是 如果有多个源系统(如果是从源到目标的一对一迁移,则更像是一种存档
浏览 1
提问于2018-09-28
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
企业级数据湖构建探索
精品PPT | “数据湖”构建汽车集团数据中台
数据湖的优势?
数据湖的未来趋势?
数据湖中的数据格式?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券