腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
对于
Hadoop
,选择哪种数据
存储
,亚马逊S3还是Azure Blob Store?
、
、
、
我正在从事一个
Hadoop
项目,并在我
的
本地集群中生成大量数据。不久之后,我将使用
基于
云
的
Hadoop
解决方案,因为与实际工作负载相比,我
的
Hadoop
集群非常小,但是到目前为止,我还没有选择我将使用哪一个,即
基于
Windows Azure、EMR或其他什么。我在本地生成了大量数据,并希望将这些数据
存储
到一些
基于
云
的
存储
中,因为我稍后将在
浏览 0
提问于2012-05-08
得票数 2
回答已采纳
1
回答
基于
Azure
的
Hadoop
集群(HDInsight)如何转化为经典
的
前提下
Hadoop
集群?
、
、
这并不是设计用来在
基于
云
的
复杂场景中运行
的
。但是,由于
云
允许通过VM模拟单个节点,
基于
云
的
Hadoop
集群应运而生。但这给我带来了理解上
的
困难。当我研究
Hadoop
集群
的
任何标准解释时,总是
基于
prem架构,因为所有
Hadoop
体系结构都是用逻辑和简单
的
on-prem视图来解释
的
。但这给理解
基于</em
浏览 2
提问于2020-09-30
得票数 0
回答已采纳
1
回答
从Windows访问
Hadoop
云
服务
、
、
、
我是
hadoop
的
新手。我正在使用雅虎提供
的
Linux,因为我不允许在我
的
机器上安装操作系统。我需要利用
云
服务,并且必须在
hadoop
相关项目上工作。当我在谷歌上搜索"
Hadoop
& Cloud“时,大多数时候我得到
的
是。但为了访问它,他们要求,因为我是在
基于
wi
浏览 4
提问于2013-04-01
得票数 2
1
回答
如何在创建
基于
google-cloud
的
hadoop
-enable集群后更改默认
存储
桶?
、
、
在我创建了一个
基于
google-cloud
的
支持
hadoop
的
集群之后,我想要将默认
存储
桶更改为不同
的
存储
桶,我该怎么做呢?我在谷歌
云
文档中找不到答案。谢谢!
浏览 8
提问于2015-10-28
得票数 0
1
回答
谷歌
云
点击部署
hadoop
、
、
、
为什么google cloud click to deploy
hadoop
工作流程需要选择本地持久磁盘
的
大小,即使您计划将
hadoop
连接器用于
云
存储
?默认大小为500 GB。我在想,如果它确实需要一些磁盘,它
的
大小应该小得多。在google云中使用
hadoop
云
存储
连接器时,是否有推荐
的
持久化磁盘大小?“在Google Cloud平台上部署Apache
Hadoop
Apache
Had
浏览 7
提问于2014-11-23
得票数 0
1
回答
雪花桌存放在哪里?
我正在考虑给客户买雪花,但是我不能告诉他们文档在哪里
存储
数据?似乎是s3,但为什么这么昂贵
的
存储
成本?用户
的
s3或雪花中
的
数据是s3吗?
浏览 2
提问于2020-03-12
得票数 0
回答已采纳
1
回答
Hadoop
在数据放在datanodes之前是否有多个本地临时文件位置?
、
、
我想我了解
Hadoop
架构和结构
的
基本知识。在将数据写入datanode之前,我会得到它被缓存在本地临时文件位置中。这是每个namenode
的
一个文件位置吗?在namenode为每个namenode指定要
存储
在哪个datanode之前,是否
存储
到集群中
的
所有数据(可能来自多个上载)?或者
Hadoop
甚至可以处理来自不同位置
的</e
浏览 4
提问于2015-01-09
得票数 0
回答已采纳
1
回答
大数据仓库解决方案?
、
、
我有十几个
存储
不同数据
的
数据库,每个数据库
的
大小都是100 in。所有数据都
存储
在AWS服务中,如RDS、Aurora和Dynamo。很多时候,我发现自己需要跨数据库执行“联接”,例如,在多个数据库中显示一个学生ID,其中包含我想要收集
的
数据。连接通常是在数据从数据库中流出之后进行
的
,因为数据不在同一个数据库中,这有时只需要对数千条记录进行几个小时。诸如或之类
的
服务是否允许您以某种方式从许多数据源“导入”数据,然后您可以执行SQL查询来加入它们?
Hadoop<
浏览 0
提问于2018-01-10
得票数 3
回答已采纳
1
回答
云
计算中
Hadoop
的
数据局部性
、
、
、
目前,
Hadoop
通过将任务分配给包含数据
的
节点或接近该节点
的
节点(例如相同
的
机架)来实现数据局部性。但是,我想知道是否可以将相同
的
概念应用于部署在一组虚拟机上
的
云
计算中,因为有关物理层
的
信息,例如哪些物理机器当前承载了这些VM,可能是不可用
的
。
浏览 5
提问于2014-01-21
得票数 2
回答已采纳
1
回答
将数据从cloudera hdfs复制到
云
存储
中
、
、
、
、
我试图在hdfs和gcp
云
存储
之间复制数据。这不是一次数据复制。第一次复制后,我希望只复制新文件,更新文件。如果文件在on上被删除,那么它也应该从
云
存储
中删除。然而,我意识到,当目标是
云
时,
基于
快照差异
的
复制不能工作。-update标志似乎不适用于
云
存储
。它复制所有文件,即使对其没有任何更改。带有快照diff
的
命令
hadoop
distcp --conf
浏览 16
提问于2022-07-29
得票数 0
1
回答
对加密数据使用HDInsight
、
、
、
我正在考虑使用HDInsight来处理必须在静态时加密
的
数据。我仍处于早期研究阶段,但我假设我可以添加一个执行解密
的
map步骤。 我是不是走错了路,或者这是一条可行
的
前进道路?另外,在内部使用什么协议来传达之前
的
map/reduce操作
的
结果?它有动态加密
的
选项吗?
浏览 7
提问于2014-11-11
得票数 0
1
回答
SalesForce和
Hadoop
哪个更好?
、
我在
Hadoop
有4年
的
经验,我想学习新
的
技术,什么对我来说是最好
的
学习.net或SalesForce?
浏览 0
提问于2015-12-09
得票数 0
4
回答
将加密与
Hadoop
结合使用
、
、
、
Cloudera文档说
Hadoop
不支持。是否可以在
Hadoop
中使用硬件加密硬盘?
浏览 1
提问于2011-10-04
得票数 5
回答已采纳
1
回答
Openstack与物理服务器上
的
Hadoop
、
我是
Hadoop
的
新手,我试图了解应该如何安装/配置
Hadoop
。从文档中我看到
Hadoop
通常应该知道物理服务器配置(例如在机架之间复制数据)。因此,对于我来说还不清楚,如果
Hadoop
安装在某些管理程序层(例如使用OpenStack)之上,在这种情况下如何实现正确
的
复制呢?请你指出这方面的文章/文件好吗?
浏览 0
提问于2015-02-11
得票数 -1
回答已采纳
5
回答
Hadoop
的
变体
我
的
一个项目是比较
Hadoop
的
不同变体,据说有很多不同
的
变体,但谷歌搜索对我来说效果不好: 有人知道
Hadoop
的
任何不同变体吗?我唯一找到
的
就是Haloop。
浏览 1
提问于2011-10-08
得票数 0
1
回答
如何避免在
云
上写入Hive暂存区域
、
、
、
OVERWRITE TABLE db.tbl_bkp PARTITION (op_cd, rpt_dt)问题是:写入hive_saging_directory需要25%
的
时间,而将ORC文件从暂存目录移到最终分区目录结构需要75%或更多
的
时间。/tbl_bkp/rpt_dt=2019-09-01/part-00037-95ee77f0-4e27-4765-a454-e5009c4f33f3.c000, Status:true 这个操作在实际
的
HDFS我听说过直接路径
浏览 20
提问于2021-11-13
得票数 2
回答已采纳
2
回答
Openstack与Cloudera
的
区别
、
、
、
我无法澄清OpenStack和Cloudera之间
的
区别。你能给我进一步
的
信息吗?
浏览 10
提问于2017-05-19
得票数 2
回答已采纳
1
回答
Hadoop
可以像Dropbox或Google一样使用吗?
、
、
、
、
我正在研究
Hadoop
和
云
存储
。所以很奇怪,
Hadoop
能像Dropbox或者Google一样使用吗?
浏览 2
提问于2017-05-02
得票数 1
回答已采纳
6
回答
Google Cloud Dataflow和Google Cloud Dataproc之间
的
区别是什么?
、
、
看看谷歌
的
云
服务,DataProc似乎也可以做同样
的
事情。为什么谷歌同时提供这两种服务?
浏览 1
提问于2017-09-27
得票数 66
3
回答
Hadoop
是什么?怎么使用呢?
、
听说
Hadoop
是做大数据并行计算
的
框架,这种跟“
云
计算“有什么区别?
浏览 760
提问于2017-09-28
点击加载更多
相关
资讯
Hadoop 存储-HDFS介绍
基于Hadoop生态系统的一种高性能数据存储格式CarbonData
基于Kubernetes的云平台存储容器化实践
Hadoop HDFS DataNode 存储机制
Apache Hadoop 3.3.0发布,正式支持腾讯云对象存储COS
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券