腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
关于
Hadoop
、Hive和Presto的问题
、
、
我正在研究使用
Hadoop
集群上的Hive,然后使用Presto对
Hadoop
中
存储
的
数据
进行一些分析,但我仍然对一些事情感到困惑:
Hadoop
和Hive是分开
存储
数据
还是Hive仅仅使用
Hadoop
中的文件?(在硬盘空间等方面?
浏览 3
提问于2014-01-24
得票数 1
回答已采纳
1
回答
hadoop
架构查询示例
、
、
目前我有两台机器,其中一台是Horton沙箱,我已经将它配置为名称节点,并将
数据
节点从它和其他机器上退役,我已经将其作为
数据
节点,并在其上安装了hive服务器。我的问题是,因为这是我第一次使用
hadoop
,我的计划是将
数据
从sql
数据
库传输到
hadoop
,所以这是否意味着我必须在datanode上安装mysql,而我将使用sqoop和其他东西?
浏览 0
提问于2015-12-02
得票数 0
1
回答
当我使用
hadoop
-mkdir时,我的文件(Dir)
存储
在哪里?
、
我对
hadoop
完全陌生,刚安装完它花了我两天时间.我现在正在尝试使用
hadoop
命令,但我只是无法理解它,尽管我已经浏览了几天,但我无法找到我想知道的答案。但是HDFS
数据
实际上
存储
在哪里呢?我以为它会
存储
在我的datanode目录(/home/
hadoop
/datastore)中,该目录是在
hadoop
.tmp.dir下的core-site.xml中定义的,但它并不存在。然后我尝试通过WEB查看,发现"input“是在&quo
浏览 2
提问于2012-07-30
得票数 8
2
回答
大
数据
存储
和查询与传统的关系/非关系
数据
库相比
、
我是一所大型州立大学的高级计算机专业,在他们的
数据
科学系担任一家大型上市科技公司的实习生。我在学校学过
数据
结构和算法(地图、树、图、排序算法、搜索算法、MapReduce等)。我的实习项目是创建一个仪表板,用于显示从
Hadoop
数据
库收集的分析
数据
。我很难理解这些
数据
是如何构造和查询的。我确信
Hadoop
中的所有
数据
都来自运行其平台的Oracle Relational产品。--我想我的核心问题是,为什么需要
Hadoop
和分布式处理从已
浏览 0
提问于2019-06-01
得票数 1
2
回答
为什么
Hadoop
没能流行起来?
、
Apache曾经被认为是
数据
科学家应该拥有的工具之一。在2012年至2014年左右,它在
数据
科学家中获得了极大的普及,并被视为与Python、R和SQL同舟共济的工具集之一。为什么
Hadoop
没有成为
数据
科学家所必需的工具之一,比如Python或R?
浏览 0
提问于2017-05-29
得票数 2
2
回答
典型的配置单元和
Hadoop
磁盘空间使用情况
、
我们有两台服务器的
Hadoop
/Hive集群,每台服务器上的Hive
数据
库使用约160 We的磁盘空间,但
Hadoop
数据
目录约为850 We。是否正常,Hive
数据
库大小与
Hadoop
数据
目录大小的典型比率是多少?
浏览 0
提问于2014-09-29
得票数 0
1
回答
Hadoop
和Spark的主要区别是什么?
、
、
最近,我读到了关于
Hadoop
与Spark的文章: 坚持内存中的列式
数据
查询。这是一个致命的特性,它允许Apache在几秒钟内运行
Hadoop
需要几个小时或几天的查询。内存比磁盘访问快得多,任何现代
数据
平台都应该进行优化,以利用这种速度。此外,柱状
数据
存储
大大减少了用于空
数据
或冗余
数据
的内存量。
浏览 0
提问于2020-09-05
得票数 3
7
回答
Hadoop
Vs
数据
湖
、
、
我听说了
数据
湖这个新名词。我在谷歌上查到了
数据
湖是一个大规模的
存储
库和处理引擎.
数据
池提供“任何类型的
数据
的大量
存储
、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖通常与面向
Hadoop
的对象
存储
相关联。在这种情况下,组织的
数据
首先加载到
Hadoop
平台,然后将业务分析和
数据
挖掘工具应用于其驻留在
Hadoop
的商品计算机集群节点上的
数据
浏览 8
提问于2016-03-14
得票数 16
1
回答
在AWS中,具有HDFS或S3的
数据
池之间有什么区别?
、
、
、
我需要在AWS上构建一个
数据
湖,但是我不知道S3和HDFS到底有什么不同。我在网上找到了一些答案,但我仍然不明白真正的区别。 我还需要知道是否有人在AWS中拥有HDFS和S3的
数据
湖架构。
浏览 2
提问于2019-07-11
得票数 1
回答已采纳
1
回答
HDFS
数据
分发
、
我对
Hadoop
很陌生,并开始学习它。关于HDFS
数据
的分发,我有一个问题。 我们最初将在哪里加载
数据
?关于Node大师?
Hadoop
是否在集群上自行分发
数据
?还是我们必须自己做?
浏览 2
提问于2017-05-11
得票数 0
1
回答
在另一个框架上执行Pig
、
我知道Pig拉丁语是一种
数据
流语言。从这个意义上说,理论上应该可以在任何框架中执行Pig拉丁语,尽管目前,它意味着在
Hadoop
环境中执行。将Pig拉丁语切换到运行在不同的框架上会有多难?如果有的话,有没有任何扩展点,或者Pig拉丁语与
Hadoop
紧密耦合?
浏览 3
提问于2011-10-13
得票数 1
回答已采纳
1
回答
为什么我们使用进行
数据
处理?为什么不在本地机器上做呢?
、
、
、
、
我很困惑,我试着把概率看成是一百万个随机数。我在google dataProc中使用MapReduce,并在spyder上运行python脚本来进行同样的操作。但是本地机器的速度越快。那我们为什么要用Mapreduce呢?下面是我使用的代码。import timeitfrom collections import Counterimport matplotlib.pyplot as plt
浏览 2
提问于2020-01-09
得票数 0
回答已采纳
2
回答
宾得和哈多普
、
、
、
如果这个问题看起来很幼稚的话,我很抱歉,但是我对
数据
工程领域还很陌生,因为我现在是一个自学的人,但是我的问题是像宾得和
Hadoop
这样的ETL产品之间有什么区别呢?当我用这个代替那个的时候?
浏览 0
提问于2018-04-25
得票数 2
回答已采纳
1
回答
hadoop
集群上的
存储
数据
库
我正在学习
Hadoop
和Hive服务器,我对一些事情感到困惑。假设我用三台机器构建了
hadoop
集群,然后开始用PHP/MySQL脚本
存储
图像。现在,对于一个MySQL
数据
库,我可以在同一个
Hadoop
服务器上安装Hive,还是必须构建另一个
Hadoop
服务器来使用Hive
存储
MySQL
数据
库。是否需要分离
Hadoop
文件服务器和
Hadoop
数据
库服务器?或者您可以将所有内容
存储<
浏览 0
提问于2015-06-03
得票数 0
5
回答
什么是"
Hadoop
“-
Hadoop
的定义?
、
、
、
、
这是很明显的,我们都会同意,我们可以称HDFS + YARN + MapReduce为
Hadoop
。但是,在
Hadoop
生态系统中,不同的其他组合和其他产品会发生什么呢?例如,HDFS + YARN + Spark仍然是
Hadoop
吗?HBASE是
Hadoop
吗?我想我们考虑的是HDFS + YARN + Pig
Hadoop
,因为Pig使用MapReduce。只是MapReduce工具被认为是
Hadoop
,但是在HDFS + YARN上运行的任何其他工具(比如火花)都是非
Had
浏览 18
提问于2015-01-24
得票数 13
回答已采纳
3
回答
hadoop
.tmp.dir应该是什么?
、
、
Hadoop
有配置参数
hadoop
.tmp.dir,根据文档,它是“其他临时目录的基础”。我想,这个路径是指本地文件系统。我将此值设置为/mnt/
hadoop
-tmp/
hadoop
-${user.name}。在格式化namenode并启动所有服务之后,我看到了在HDFS上创建的完全相同的路径。这是否意味着,
hadoop
.tmp.dir指的是HDFS__上的临时位置?
浏览 16
提问于2010-03-01
得票数 27
回答已采纳
1
回答
区域服务器datanode在
hadoop
集成中的作用
、
根据我的理解,行被插入到HBase表中,并作为区域
存储
在不同的区域服务器中。因此,区域服务器
存储
数据
。2个节点-主从节点 -
浏览 0
提问于2012-12-06
得票数 19
回答已采纳
1
回答
对于
Hadoop
,选择哪种
数据
存储
,亚马逊S3还是Azure Blob Store?
、
、
、
我正在从事一个
Hadoop
项目,并在我的本地集群中生成大量
数据
。不久之后,我将使用基于云的
Hadoop
解决方案,因为与实际工作负载相比,我的
Hadoop
集群非常小,但是到目前为止,我还没有选择我将使用哪一个,即基于Windows Azure、EMR或其他什么。我在本地生成了大量
数据
,并希望将这些
数据
存储
到一些基于云的
存储
中,因为我稍后将在
Hadoop
中使用这些
数据
,但很快就会使用这些
数据
。 我正在寻
浏览 0
提问于2012-05-08
得票数 2
回答已采纳
1
回答
如何
存储
HDFS块中的
数据
?
、
、
我读到了关于HDFS的文章,想知道是否有任何特定的格式来安排块中的
数据
。 我怀疑64 MB块中是否存在
存储
数据
的格式?如果在块中
存储
数据
的格式/结构,则
存储
的
数据
应该小于64 MB,因为
数据
结构/标头等本身可能占用一
浏览 3
提问于2015-01-10
得票数 2
回答已采纳
2
回答
在
hadoop
单节点集群上添加EBS卷
、
、
、
我在AWS云上创建了一台具有AWS根卷的8 GB Linux机器,然后部署了
hadoop
,并在该机器上创建了单节点集群。none 100M 0 100M 0% /run/user /dev/xvdb
浏览 5
提问于2017-12-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hadoop 存储-HDFS介绍
Hadoop HDFS DataNode 存储机制
Hadoop环境中管理大数据存储八大技巧
Hadoop大数据存算分离下,如何解决新旧存储共存?
Hadoop大数据存算分离方案:计算层无缝对接存储系统
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券