腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Sqoop从HIVE导出到
分区
Oracle数据库
、
、
、
我在Hive中有一个非
分区
表,它使用一个批处理来填充60万条记录。此批处理在填充表之前清除表中的数据。我正在尝试将这些数据导出到
分区
的oracle表中。当首次导出时,sqoop导出是成功的。但是,当试图将数据导出为另一个
分区
时,我将得到以下错误。 我想在这里实现的是,sqoop导出应该将数据导出到不同的
分区
。org.apache.sqoop.
mapreduce
.AsyncSqlRecordWriter.write(AsyncSqlRecordWriter.java:233)错误: java.io.IOEx
浏览 3
提问于2022-01-05
得票数 0
1
回答
Hadoop
MapReduce
、
如何对字数统计程序进行二次排序,使最终输出按降序显示?(基于值)
浏览 1
提问于2016-12-08
得票数 0
1
回答
Hadoop Oozie
MapReduce
操作自定义
分区
程序
、
、
、
、
如何在oozie工作流XML上为
MapReduce
操作配置自定义
分区
程序?我尝试使用: <name>
mapreduce
.job.partitioner.class</name></property> <name>
mapreduce
.partition
浏览 0
提问于2017-08-02
得票数 0
1
回答
未在Oozie
Mapreduce
操作中工作的自定义
分区
器
、
、
、
、
我在
mapreduce
中实现了二级排序,并试图使用Oozie (来自Hue)来执行它。<workflow-app name="MyTriplets" xmlns="uri:oozie:workflow:0.5"> <start to="
mapreduce
Action failed, error message[${wf:errorMessa
浏览 0
提问于2017-09-12
得票数 0
回答已采纳
1
回答
sqoop导出mysql
分区
、
、
、
我正在尝试使用sqoop从
分区
的hive表导出到mysql。Open failed for file /path/to/table/<table name>/<partition name>, attempt to open a directoryat com.cloudera.sqoop.
mapreduce
.CombineShimRecordReader.getCurrentK
浏览 1
提问于2013-01-21
得票数 0
回答已采纳
3
回答
从
MapReduce
作业向Hive添加
分区
、
、
、
我对Hive和
MapReduce
很陌生,非常感谢您的回答,并提供了一个正确的方法。 对于第二种方法,我只看到了IN
浏览 5
提问于2013-01-11
得票数 3
2
回答
如何在星火RDD中创建
分区
我想知道在基RDD中创建了多少
分区
。不是真的吗。
分区
是根据块大小决定的吗? 在上述情况下,编号。
分区
数是3?
浏览 1
提问于2016-05-10
得票数 1
回答已采纳
1
回答
星火中的默认
分区
方案
、
、
rdd.partitioner.get它说有10个
分区
,
分区
是使用HashPartitioner完成的。scala> rdd.partitions.sizescala> rdd.partitioner.isDefined它说有4个
分区
,没有定义
分区
。那么,Spark中的默认
分区</e
浏览 1
提问于2015-12-28
得票数 20
回答已采纳
2
回答
如果定制
分区
器被用来为具有相同密钥的记录选择不同的
分区
,该怎么办?
、
、
、
在学习Hadoop
MapReduce
时,我偶然发现了如何创建自定义
分区
器类。我知道我们需要在类中定义抽象的getPartition方法。这个方法应该返回当前键值对的
分区
号(一个整数)。现在,
分区
的数量将等于减少作业的任务数。如果在自定义
分区
器中,一个人写了一些逻辑来根据'value‘而不是'key’来选择
分区
呢?根据我的理解,这可能意味着具有相同键(但不同值)的记录可能会被不同的reduce任务处理,这不是
MapReduce
所保证的。这不是异常吗?
浏览 1
提问于2015-09-02
得票数 1
回答已采纳
1
回答
火花如何决定任务的数量?
、
、
但是,我认为有26个任务,每个
分区
有一个任务,每个文件有一个
分区
。 如果有人能给我更多关于实际发生的事情的见解,那就太好了。
浏览 2
提问于2016-11-18
得票数 4
2
回答
如何使用RDD在
分区
内排序(并避免跨
分区
排序)?
Hadoop
MapReduce
洗牌的默认行为是在
分区
内对混叠键进行排序,而不是跨
分区
排序(使键跨
分区
排序的是总顺序)。我会问如何使用Spark (
分区
内排序,但不是跨
分区
排序)实现相同的目标。RDD的sortByKey方法是进行全排序 RDD的repartitionAndSortWithinPartitions是在
分区
内进行排序,而不是跨
分区
,但不幸的是,它增加了一个额外的步骤来执行重新
分区
是否有一种直接的方法在
分区</
浏览 3
提问于2017-04-11
得票数 15
回答已采纳
2
回答
当文件大于块大小时,如何减少蜂箱中映射器的数量?
、
伙计们,我在单元中有一个表,它有720个
分区
,每个
分区
有400多个文件,文件的平均大小是1G。现在我执行以下SQL:插入覆盖表test_abc select *从DEFAULT.abc A,其中A.P_HOUR ='2017042400‘;set mapred.min.split.size.per.rack=5000000000;set
mapreduce</e
浏览 4
提问于2017-04-28
得票数 3
回答已采纳
2
回答
Hadoop
MapReduce
appcache目录
、
我在一个单节点Hadoop集群上运行一个
MapReduce
作业,但是我的磁盘驱动器被
MapReduce
目录中的attempt_*_spill_*.out文件完全填满了。
浏览 4
提问于2014-03-31
得票数 1
回答已采纳
4
回答
可用于使用Hadoop/
MapReduce
框架的群集
、
、
有谁知道任何
免费
访问的集群,这些集群对公众开放,并且使用Hadoop/
MapReduce
框架?有很多关于如何使用
MapReduce
的教程,但是有没有一种方法可以在不使用本地单机并安装所需框架的情况下测试这些示例呢? 谢谢!
浏览 0
提问于2011-03-17
得票数 3
回答已采纳
1
回答
Spark创建的
分区
比minPartitions在WholeTextFiles上的参数少
、
、
、
、
然后,我不会在任何地方使用合并/重新
分区
,而是使用7-8
分区
完成我的DAG。我在这里看到了一个主题,但是它是关于“更多”
分区
的,这对我一点帮助都没有。注意:在程序中,我读取了另一个包含10个文件的文件夹,Spark成功地创建了10个
分区
。在这个成功的工作完成后,我运行上面的问题转换。
浏览 1
提问于2018-08-01
得票数 2
回答已采纳
2
回答
单元-对
分区
的查询不返回任何内容。
、
我可以查询最新的
分区
(前一天的数据),它将很好地使用
分区
。...garbage...
MapReduce
Jobs Launched: Job 0: Map: 1 Reduce: 1 Cumulative CPU: 6.43 sec HDFS Read: 46281957 HDFS然而,当我试图查询更早的
分区
时,hive似乎可以很好地读取
分区
,但不返回任何结果
浏览 2
提问于2012-11-02
得票数 2
1
回答
进程脚本由于堆空间问题而失败,无法处理太多的
分区
、
、
、
我的脚本由于堆空间问题而失败,无法处理太多的
分区
。为了避免这个问题,我尝试将所有
分区
插入到一个
分区
中,但我面临以下错误 set
mapreduce
.reduce.memory.mb=6144; set
mapreduce
.reduce.java.opts
浏览 6
提问于2021-01-19
得票数 1
回答已采纳
1
回答
分页数据映射/缩减
、
我已经编写了用于对数据集进行
分区
的自定义
分区
程序。我希望使用相同的
分区
程序对两个数据集进行
分区
,然后在下一个
mapreduce
作业中,我希望每个映射器处理来自两个源的相同
分区
,并执行一些功能,如连接等。我如何确保一个映射器从两个源获得对应于相同
分区
的拆分? 任何帮助都将不胜感激。
浏览 3
提问于2010-07-04
得票数 2
2
回答
从
mapreduce
读取配置单元表
、
、
我目前正在编写一个
mapreduce
程序来找出两个hive表之间的差异。我的配置单元表在一个或多个列上进行
分区
。因此,文件夹名称包含已
分区
列的值。 有没有办法读取配置单元
分区
表。
浏览 0
提问于2013-04-24
得票数 2
回答已采纳
1
回答
mapreduce
分区
中的数据是否排序,如果是,它是如何发生的?
、
、
、
、
mapreduce
分区
内的数据是否排序,如果是,如何排序?AFAIK,它是根据密钥分组的。如果它在内部排序,那么对所有
分区
中的所有数据进行排序不是一种开销吗?
浏览 1
提问于2014-09-25
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
5 个免费的 Linux 分区管理器
MapReduce详解
MapReduce(一)
弹性MapReduce
MaxCompute MapReduce
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券