腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
使用
Hadoop
的
相似连接
我是刚认识
hadoop
的
。我想跟你谈谈我想出
的
一些方法。2个
数据
集
:A和B。 map阶段:对于每个记录在A访问HDFS和拉记录B进行匹配;
浏览 0
提问于2010-10-29
得票数 6
回答已采纳
1
回答
多个映射器输入和1个减速器输出
的
Hadoop
命令错误(连接2个文件
中
的
2个值)
、
下面是我
加入
两个
数据
集
的
示例程序。该程序有
两个
映射器和一个减速器,连接从
两个
不同
的
映射器得到
的
值,有
两个
不同
的
文件作为输入。 它实际上只期望一个输入路径和一个输出路径,而在我
的
命令<e
浏览 2
提问于2014-10-13
得票数 0
1
回答
验证大量记录
、
验证源端到Target
的
记录行
中
的
每个
数据
点
的
主要测试技术/方法是什么?如何处理在初始和增量ETL过程
中
需要验证
的
数百万条记录。
浏览 0
提问于2019-03-15
得票数 0
1
回答
星火
的
地图和减少操作是不同于
Hadoop
减少
的
吗?如果是,那么怎么做?
、
、
我正在浏览星火文件,发现了下面的一行1.请您帮助我理解星火图减少与
hadoop
地图减少有何不同吗?RDD是如何在火花中工作
的
?它总是像蜂巢一样将代码转换成
mapreduce
吗?
浏览 0
提问于2018-11-14
得票数 1
1
回答
Hadoop
,蜂箱,动物园管理员等
、
、
我开始了解
hadoop
。我对它有了一些了解,但是当我读到关于Hive,Pig和其他Apache工具时,我感到很困惑。因此,有人能简单地概述一下
hadoop
和Apache
的
工具(Hive、Pig、等),我想知道它们在处理大
数据
时是如何和在哪里使用
的
。
浏览 3
提问于2014-05-20
得票数 0
回答已采纳
4
回答
Hadoop
Map Reduce与Google Map Reduce
的
差异
、
Hadoop
Map Reduce和Google Map Reduce有什么区别? 仅仅是
Hadoop
为map reduce等提供了标准化吗?不同之处还包括什么?
浏览 2
提问于2012-07-08
得票数 18
2
回答
YARN和MR2有什么区别吗?
、
、
、
它们是一样
的
吗?我在一些文档中看到了YARN作为运行分布式应用程序
的
平台,
MapReduce
作为分布式应用程序,这是什么意思?这是一个由程序员构建
的
MapReduce
应用程序(例如:wordcount程序)吗?我又一次看到“编写你自己
的
YARN应用程序”,这是什么意思?如果它不在堆栈溢出标准
中
,请纠正问题,我试图表达我所有的疑问。
浏览 1
提问于2017-10-09
得票数 1
1
回答
MapReduce
工作流基准测试
、
、
、
、
任何机构都可以通过任何基准来测试
MapReduce
工作流吗?或者一般情况下,BigData工作流基准测试一些工作流系统
的
性能和准确性,如Oozie? 谢谢
浏览 3
提问于2014-04-09
得票数 0
3
回答
Hadoop
-
MapReduce
的
小型
数据
集
、
、
、
我正在尝试熟悉
Hadoop
-
MapReduce
。在学习了这些概念
的
理论知识后,我想对它们进行实践。 但是,我找不到适用于这项技术
的
小
数据
集
(最大3 Gb )。我在哪里可以找到
数据
集
,以便进行练习?或者,我如何实践
Hadoop
-
MapReduce
?换句话说,有没有提供练习
的
教程或网站?
浏览 1
提问于2012-10-16
得票数 4
2
回答
Hadoop
MapReduce
vs MPI ()--什么时候使用其中一种而另一种?
、
、
、
我对并行计算很陌生,刚刚开始在Amazon上试用MPI和
Hadoop
+
MapReduce
。但我不知道什么时候该用一种而另一种。 但是,我也看到了
MapReduce
on MPI ()
的
实现,它不提供容错,但在某些基准测试上比在<em
浏览 5
提问于2015-01-06
得票数 17
回答已采纳
3
回答
Hadoop
是什么?怎么使用呢?
、
和
MapReduce
一样吗?听说
Hadoop
是做大
数据
并行计算
的
框架,这种跟“云计算“有什么区别?
浏览 730
提问于2017-09-28
1
回答
如何使用红移查询S3公共
数据
集
、
、
我正在使用SQL工作台连接到我
的
redshift集群,我可以正常连接,但不能运行任何命令…… 如何查询常见
的
爬网s3
数据
集
?
浏览 0
提问于2015-06-30
得票数 0
3
回答
性能比较: Hive和
MapReduce
、
、
使用运行时
数据
的
实际用例场景将是真正
的
帮助. 谢谢
浏览 1
提问于2013-01-16
得票数 0
1
回答
默认情况下,
mapreduce
程序是否会消耗文件夹
中
的
所有文件(输入
数据
集
)?
、
你好啊斯塔克沃夫
的
好人,我没有意识到在同一个文件夹
中
还有另外
两个
文件。
Mapreduce
程序继续读取所有3个文件,并给出了输出。输出很好。这是
mapreduce
的
默
浏览 4
提问于2016-06-27
得票数 1
回答已采纳
1
回答
更改spark _temporary目录路径,避免删除parquets
、
、
当
两个
或多个Spark作业具有相同
的
输出目录时,相互删除文件将不可避免。我正在使用spark 2.4.4在append模式下写入一个
数据
帧,我想在spark
的
tmp目录
中
添加一个时间戳,以避免这些删除。示例:使用其他
数据
调用相同
的
spark作业,并在hdfs:/outputFil/0/
浏览 20
提问于2020-03-19
得票数 1
1
回答
为什么
Hadoop
选择
MapReduce
作为其计算引擎?
我知道
MapReduce
(MR)是
Hadoop
的
三个核心框架之一,我熟悉它
的
mapper-shuffle-reducer进程。我
的
问题可以分为
两个
部分:2)其他语言(如:shell、python)
的
计算部分是如何工作
的
?它们
的
计算过程与MR相似吗?
浏览 0
提问于2018-05-30
得票数 0
3
回答
MapReduce
连续执行
、
、
、
我正在使用
Hadoop
将现有的时间序列
数据
库系统转换为
MapReduce
模型。该
数据
库系统具有历史处理能力和实时处理能力.到目前为止,我能够将批处理功能转换为
Hadoop
。不幸
的
是,当涉及到实时处理时,我发现与
MapReduce
模型存在一些概念上
的
不一致。我可以编写我自己
的
Hadoop
的
InputFormat接口
的
实现,它将不断地向映射器提供新
的
数据</e
浏览 2
提问于2014-02-25
得票数 4
回答已采纳
1
回答
地图约简中
的
键值
、
我只是
Hadoop
框架
的
初学者。我想在这里了解几个概念,我浏览了这么多链接,但我想得到明确
的
答案: 1)为什么Map reduce只与键值对一起工作,我还读到,我可以创建一个Map reduce作业,而不用实际使用reduce 2)键,因为映射阶段
的
输入是文件偏移键。
浏览 5
提问于2016-03-02
得票数 0
回答已采纳
3
回答
火花和
Hadoop
有什么不同?
、
在其主页
中
,有人说它比
Hadoop
框架更好。但是他们说:火花运行在
Hadoop
..。我真的不明白为什么可以在
Hadoop
上运行,而它应该比
Hadoop
更好。 有人能解释一下这两者之间
的
等级吗?
浏览 6
提问于2017-10-22
得票数 1
回答已采纳
1
回答
当我在
Hadoop
1.2.1
中
使用时,我想从父类HashPatitioner构建一个新
的
MyPatitioner
、
当我在
Hadoop
1.2.1
中
使用时,我想要从父类散列器构建一个新
的
类MyPatitioner,并且它( when )是可以
的
。job.setPartitionerClass(MyPartitioner.class); 提示: Job类型
中
的
方法setPartitionerClass(类)不适用于参数(类)。
浏览 0
提问于2013-09-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深入理解与应用Hadoop中的MapReduce
浅析大数据分析中对MapReduce的理解
MapReduce 中的数据局部性(Data Locality)是什么?
大数据hadoop框架中的服务角色详解
如何将kafka中的数据快速导入Hadoop?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券