腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
6
回答
如何搭建
Hadoop
处理环境?
、
、
、
、
Apache
Hadoop
是用于开发在
分布式
计算环境中执行数据处理应用程序的框架。旨在从单个服务器提供
存储
和计算资源的方式扩展到数千台机器。Apache
Hadoop
的核心部分由
存储
部分(
Hadoop
分布式
文件系统)及其数据处理部分(MapReduce)组成。
Hadoop
将文件分割成大块,并将它们分发到群集中的节点上。那么如何搭建
Hadoop
处理环境?
浏览 2027
提问于2018-10-24
2
回答
当HDFS已经提供数据
存储
时,为什么还要使用Hive?
、
、
我已经开始学习
Hadoop
了,我知道HDFS提供了
分布式
存储
系统,Mapreduce是用于data processing.Now的,我正在阅读
Hadoop
生态系统。从Hive的定义来看,它是一个构建在
hadoop
上的数据仓库,用于提供类似SQL的接口。 我的问题是,当
hadoop
提供容错、
分布式
的HDFS时,为什么要使用hive?hive会取代HDFS吗?hive是否也只提供sql接口或
存储
?
浏览 1
提问于2018-07-26
得票数 0
1
回答
我们如何处理
Hadoop
DB中处理过的数据(输出)?
、
、
我是
Hadoop
的新手,如果我的问题太不成熟,我深表歉意。 我知道
Hadoop
用于分析大型数据集上的数据。最后,我们如何处理分析的数据,创建报告和演示文稿?但是,在基于
Hadoop
的数据库中是如何工作的呢?在客户端,如果请求特定的报告,这需要来自
Hadoop
DB的数据点,那么流程会是怎样的?我确信客户端不会直接在
hadoop
中运行Job来获取生成报告所需的数据,因为
hadoop
作业需要更多的时间来处理。我的问题是,通过在
hadoop
DB上运行MR作业,处理的数据(结
浏览 2
提问于2015-12-23
得票数 0
0
回答
上传文件到HDFS是否会自动以
分布式
方式
存储
文件?
、
我刚刚开始学习
Hadoop
,我对如何以
分布式
方式
存储
数据感到有点困惑。我有MPI背景。对于MPI,我们通常有一个主处理器,它将数据发送到各种其他处理器。这是由程序员显式完成的。有了
Hadoop
,您就拥有了
Hadoop
分布式
文件系统(HDFS)。那么,当您将本地服务器中的某些文件放入HDFS时,HDFS是否会自动以
分布式
方式
存储
此文件,而无需程序员执行任何操作?
浏览 8
提问于2019-01-26
得票数 1
回答已采纳
6
回答
在
Hadoop
中搜索/查找文件和文件内容
、
、
、
、
我目前正在使用
Hadoop
进行一个项目。 在其他
分布式
文件系统中呢?文件内容搜索是
分布式
文件系统的软点吗?
浏览 13
提问于2011-06-09
得票数 23
回答已采纳
1
回答
用于
分布式
数据
存储
的
Hadoop
或Spark连接器是如何工作的?
、
、
Spark具有用于各种数据库和数据
存储
的连接器。我希望了解
Hadoop
连接器的语义,以便能够为我的自定义数据库创建一个连接器。
浏览 1
提问于2016-02-26
得票数 0
5
回答
如何在单机上最佳运行
Hadoop
?
、
、
、
、
我可以访问一台运行Linux的计算机,它有20个内核,92 GB的RAM和100 GB的硬盘
存储
器。我想使用
Hadoop
来完成一项涉及大量数据(超过100万字,超过1B字组合)的任务。将伪
分布式
模式或完全
分布式
模式作为在一台计算机上充分利用
Hadoop
功能的最佳方法??。 对于我打算使用
Hadoop
来说,经历数据丢失和由于节点失败而不得不重新运行作业并不是什么大问题。涉及到的使用完全
分布式
模式。描述伪
分布式
模式;更详细的信息可以找到。
浏览 7
提问于2015-07-30
得票数 11
1
回答
对于
Hadoop
:哪个数据
存储
?
、
、
为此,我正在考虑将
Hadoop
用于MapReduce和
分布式
计算。使用MapReduce模式,我可以创建每组100.000条记录,并将它们分布在集群上,以便进行一些
分布式
分析/计算。除此之外,我还必须
存储
所有这些记录,并每个月使用它们来改进我每天计算的算法。哪家商店最适合这种情况?我正在考虑HBase或CouchDB,因为我认为它们很适合我的需求。
浏览 3
提问于2015-02-11
得票数 0
1
回答
Hadoop
到底是干什么用的,主要的应用场景和应用领域是什么?
Hadoop
到底是干什么用的,主要的应用场景和应用领域是什么,主要解决的核心问题又是什么,我们个人可以用它来干什么 产生价值呢?
浏览 944
提问于2020-09-24
5
回答
什么是"
Hadoop
“-
Hadoop
的定义?
、
、
、
、
这是很明显的,我们都会同意,我们可以称HDFS + YARN + MapReduce为
Hadoop
。但是,在
Hadoop
生态系统中,不同的其他组合和其他产品会发生什么呢?例如,HDFS + YARN + Spark仍然是
Hadoop
吗?HBASE是
Hadoop
吗?我想我们考虑的是HDFS + YARN + Pig
Hadoop
,因为Pig使用MapReduce。只是MapReduce工具被认为是
Hadoop
,但是在HDFS + YARN上运行的任何其他工具(比如火花)都是非
Had
浏览 18
提问于2015-01-24
得票数 13
回答已采纳
3
回答
火花和
Hadoop
有什么不同?
、
在其主页中,有人说它比
Hadoop
框架更好。但是他们说:火花运行在
Hadoop
..。我真的不明白为什么可以在
Hadoop
上运行,而它应该比
Hadoop
更好。 有人能解释一下这两者之间的等级吗?
浏览 6
提问于2017-10-22
得票数 1
回答已采纳
1
回答
有没有像
Hadoop
这样的
分布式
存储
,但又有ZFS的优点?
、
、
、
、
有没有像
Hadoop
这样具有ZFS优点的
分布式
存储
?
浏览 0
提问于2011-04-21
得票数 1
1
回答
siebel应用程序
hadoop
连接
、
我想了解
hadoop
是否支持siebel应用程序,有没有人可以分享这样做的经验。我查找了在线文档,但在这里找不到任何适当的链接来解释这个发布问题 我已经和siebel应用程序一起运行Oracle数据库了,我想用
HAdoop
替换..is有可能吗?
浏览 1
提问于2014-02-24
得票数 1
3
回答
Hadoop
是什么?怎么使用呢?
、
听说
Hadoop
是做大数据并行计算的框架,这种跟“云计算“有什么区别?
浏览 725
提问于2017-09-28
2
回答
Oozie shell操作可以在HDFS上创建输出文件吗?
、
我是Oozie和
Hadoop
的新手。我想问一下,是否可以在Oozie中运行shell操作,并将输出
存储
到
Hadoop
分布式
文件系统上的一个文件中。
浏览 0
提问于2015-04-02
得票数 2
1
回答
Hadoop
可以像Dropbox或Google一样使用吗?
、
、
、
、
我正在研究
Hadoop
和云
存储
。所以很奇怪,
Hadoop
能像Dropbox或者Google一样使用吗?
浏览 2
提问于2017-05-02
得票数 1
回答已采纳
12
回答
如果没有
hadoop
,apache能运行吗?
、
、
、
、
火花和
Hadoop
之间有依赖关系吗? 如果没有,那么当我运行而没有
Hadoop
时,是否会忽略一些特性?
浏览 10
提问于2015-08-15
得票数 119
回答已采纳
1
回答
hdfs文件在伪
分布式
单节点集群中的位置?
、
、
、
我将
hadoop
安装在一个节点上,采用伪
分布式
模式。dfs.replication值为1。默认情况下,hdfs中的文件
存储
在哪里?我使用的
hadoop
版本是2.5.1。
浏览 3
提问于2015-04-30
得票数 0
回答已采纳
3
回答
为什么要使用
Hadoop
?
、
我对
Hadoop
的用法并不感到困惑。我不知道何时何地使用
Hadoop
。 根据定义,这项工作还由Oracle、MSSQL等其他数据库完成,即跨集群
存储
和处理数据。那么使用
Hadoop
还有什么优点呢?
浏览 3
提问于2015-08-12
得票数 1
回答已采纳
5
回答
小文件和HDFS数据块
、
Hadoop
分布式
文件系统中的一个块是
存储
多个小文件,还是一个块只
存储
一个文件?
浏览 5
提问于2011-12-19
得票数 12
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hadoop 存储-HDFS介绍
Hadoop HDFS DataNode 存储机制
Hadoop完全分布式搭建
Hadoop伪分布式搭建(一)
Hadoop-伪分布式模式搭建
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券