腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1320)
视频
沙龙
1
回答
如
何在
java
sdk
v2
中
向
正在
运行
的
EMR
集群
提交
新
步骤
、
、
我
正在
尝试使用
java
sdk
v2
向
正在
运行
的
EMR
集群
提交
一个HadoopJarStep。通过阅读api文档/示例,我似乎想不出如何引用一个
正在
运行
的
集群
而不是旋转一个
新
的
集群
。有人能告诉我正确
的
构建器方法来指定要
提交
浏览 19
提问于2020-06-23
得票数 0
回答已采纳
1
回答
我是否可以像在本地群集上一样在
EMR
上
运行
作业
、
、
、
我已经在我
的
笔记本电脑上构建了一个本地
集群
(伪模式)。在那里我
运行
不同
的
mapreduce命令,比如 -D mapred.output.compression.codec\ -input /aws/input/input_warc.txt \现在我必须在电子病历上<e
浏览 0
提问于2017-01-12
得票数 0
2
回答
如
何在
Amazon上
运行
Python火花代码?
、
、
、
我已经编写了一个python代码,我想在Amazon
的
上
运行
它。 我
的
代码在我
的
本地机器上工作得很好,但是我对如
何在
Amazon
的
AWS上
运行
它感到有点困惑?或者,我应该将ssh转换为Master并将我
的
python代码scp到Master
中
的
火花文件夹
中
吗?现在,我尝试在我
的
终端上本地
运行
代码并连接到
集群
地址(我是通过读取火花
的</em
浏览 3
提问于2016-11-05
得票数 9
回答已采纳
2
回答
如何使用AWS Lambda在AWS
EMR
上
运行
PySpark
、
、
、
如何通过AWS Lambda使我
的
PySpark代码与AWS
EMR
一起
运行
?我是否必须使用AWS Lambda创建一个自动终止
的
EMR
群集来
运行
一次S3存储
的
代码?
浏览 0
提问于2020-06-03
得票数 0
2
回答
AWS阶跃函数
中
的
Pass变量
、
、
、
我是非常新
的
AWS
步骤
函数和AWS Lambda函数,并可能真的需要一些帮助。我有一个状态机,在这里我试图检查某个文件是否存在于我
的
S3桶
中
,然后让状态机按照一个路径
运行
,如果该文件存在,那么另一个路径,如果它不存在的话。
如
您所见,我试图使用Lambda函数返回变量FoundNecessaryFiles,状态为true/false,具体取决于是否找到了该文件,并使用该值指导下一步
的
选择。最好是通过修正变量回传来解决这个问题,因为我可能需要在稍后
的</e
浏览 0
提问于2019-10-14
得票数 3
回答已采纳
1
回答
在电子病历
中
运行
火花作业时
的
IllegalAccessError
、
、
、
、
我
正在
尝试
运行
一个访问dynamodb
的
星星之火作业,并且已经不再推荐实例化dynamoDb客户机
的
旧方法,现在建议使用客户机构建器。
中
的
异常:尝试从类com.amazonaws.services.dynamodbv2.AmazonDynamoDBAsyncClientBuilder访问类
java
.lang.IllegalAccessError_1)我
的
build.sbt包含: libraryDependencies += &q
浏览 0
提问于2017-04-05
得票数 2
2
回答
自动化标准Mahout推荐器
、
、
、
现在我
正在
考虑自动化这个执行,以便一个专用
的
Lambda函数
向
EMR
提交
一个
步骤
,并忘记它。最简单
的
方法是什么?是否可以在不使用
Java
编写整个推荐应用程序
的
情况下将其作为Hadoop
的
JAR
步骤
提交
?在深入研究了一段时间之后,最简单
的
选择(至少对我来说)是
EMR
集群
上
的
“自定义JAR”作业,具有以下参数:
浏览 2
提问于2016-07-29
得票数 0
1
回答
从ECS码头集装箱
运行
EMR
作业
、
我已经将用python编写
的
ML作业代码包含到一个码头容器
中
,并能够使用Amazon作为码头服务
运行
。我想使用星星之火以分布式方式
运行
,并在亚马逊
EMR
.Can上部署,建立ECS和
EMR
之间
的
连接?
浏览 3
提问于2017-05-25
得票数 9
回答已采纳
1
回答
在哪种情况下,人们应该更喜欢在EC2机器上创建星火
集群
而不是使用弹性地图减少?
、
在EC2机器上使用星盘
集群
处理实时数据和使用弹性映射约简处理实时数据之间
的
一些区别是: 我知道,使用Elastic将提供不必管理
浏览 2
提问于2020-10-22
得票数 0
1
回答
在单个
EMR
集群
中
调用多个火花作业
、
、
我想调用多个火花作业使用火花
提交
在单个
EMR
集群
内。
EMR
支持这一点吗?如何做到这一点?在这个时候,我使用AWS Lambda来调用
EMR
作业,但是我们希望扩展到单个
EMR
集群
中
的
多个火花作业。
浏览 3
提问于2019-03-31
得票数 1
1
回答
如何使火花保存它
的
临时文件在S3上?
、
、
我
正在
AWS
EMR
集群
上
运行
spark作业,从客户端主机
提交
它们。客户端机器只是一个EC2实例,它以
集群
模式
向
EMR
提交
作业。问题是- spark可以保存200 is
的
临时文件,如下所示:Tmp文件夹很快就会被这样<e
浏览 2
提问于2018-10-01
得票数 0
回答已采纳
2
回答
是否可以将AutoScaling与弹性映射推理结合使用?
、
我想知道,我是否可以使用AutoScaling自动升级或下降亚马逊
的
Ec2容量,根据cpu
的
利用率与弹性地图减少。例如,我只使用一个实例启动mapreduce作业,但是如果该实例达到50%
的
利用率(例如,我希望使用创建
的
AutoScaling组来启动一个
新
实例)。这有可能吗? 你知道这是否可能吗?或者弹性mapreduce,因为它是“弹性
的
”,如果它需要自动启动更多
的
实例而没有任何配置?
浏览 3
提问于2015-04-24
得票数 0
回答已采纳
2
回答
使用Step函数
运行
AWS
EMR
集群
、
、
、
我对AWS Step函数和AWS Lambda函数非常陌生,我真的需要一些帮助来让
EMR
集群
通过Step函数
运行
。这些任务
正在
正常工作。在我目前
的
结构
中
,第一项任务是建立一个
EMR
集群
。我也有一个JSON文件(名为
EMR
-RUN-Script.json)位于我
的
S3桶上,它将
向
<e
浏览 3
提问于2019-10-14
得票数 1
1
回答
如
何在
没有HDFS或
EMR
引导
步骤
的
所有工作节点上创建文件
、
、
、
我在
EMR
-5.30
集群
上
运行
ApacheSpark2.4.5。我
的
驱动程序节点
正在
做一些工作,从外部服务
中
检索数据,因此我可以将其放入文本文件
中
,并将副本分发给所有工作节点。我想出了一些可能
的
解决方案,用于
向
所有工作节点分发文件,但意识到这些解决方案是行不通
的
: 使用
EMR
引导操作
提交
运行
shell脚本
的
EMR
步骤</
浏览 1
提问于2021-07-06
得票数 0
1
回答
AWS
EMR
在
集群
中所有已
运行
的
计算机上执行"bootstrap“脚本
、
、
、
、
我有一个全天候
运行
的
EMR
集群
,我不能关闭它并启动
新
的
集群
。1)在所有
正在
运行
的
实例上
运行
该脚本(如果可以这样做的话就更
浏览 1
提问于2014-10-27
得票数 17
4
回答
如何使用boto3 (或其他方式)在电子病历上自动化火花放电作业?
、
、
、
、
我
正在
创建一个任务来解析大量
的
服务器数据,然后将其上传到Redshift数据库
中
。我
的
工作流程如下: 将数据从S3上传到Redshift。不过,我还想不出如何实现自动化,这样我
的
过程就会产生一个
EMR
集群
,引导正确
的
安装程序,并
运行
我
的
python脚本,它将包含用于解析和编写
的
代码。
浏览 7
提问于2016-04-19
得票数 17
回答已采纳
1
回答
Google Dataproc Presto:如何使用Python
运行
查询
、
、
、
、
通过执行此
中
的
步骤
,我已经设置了一个
运行
Presto
的
Google Dataproc
集群
。 --execute "SELECT COUNT(*) FROM chicago_taxi_trips_parquet;" 最后,本教程展示了如何通过
java
我
正在
尝试用Python找到类似的
浏览 13
提问于2021-03-14
得票数 3
1
回答
EMR
群集无法在另一个桶中下载引导操作。
、
、
我
正在
尝试使用引导操作()来修补AWS
集群
。但是,同一
集群
是在同一帐户下在两个区域A和B
中
创建
的
。迄今所采取
的
步骤
: The bu
浏览 21
提问于2022-02-28
得票数 0
回答已采纳
4
回答
在
EMR
上
向
Spark添加JDBC驱动程序
、
、
我
正在
尝试将JDBC驱动程序添加到在Amazon之上执行
的
Spark
集群
中
,但我一直得到以下内容: 使用addJar显式地从代码
中
添加驱动程序Jar。使用spark.driver.userClassPathFirst=true时,当我使用这个选项时,我得到了一个不同
的
错误,因为将依赖项与Spark混合在一起,如果我只想添加一个JAR,那么这个选项看起来就太
浏览 3
提问于2015-09-24
得票数 3
1
回答
在AWS中使用AddJobFlowStep
的
正确方法是什么?
、
、
、
我使用go AWS创建了一个
集群
,并在其中添加了一个作业流
步骤
。但是,当我编程执行该
步骤
时,它
的
执行总是失败
的
。值得注意
的
一点是,当我从UI
中
附加jar时,它成功地执行了。因此,当jar从UI附加时,这是
步骤
执行
的
结果(它成功
运行
并移动到已完成
的
状态):(复制全文) JAR位置:命令-runner.jar主类:无参数:星火-
提交
--部署模式
集群
--类Hello
浏览 4
提问于2017-03-21
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
AWS EMR在搭建大数据平台ETL中的应用实践
EMR 实战心得浅谈
Komodo Health 公司如何在 EKS 与 EMR 6 上使用多租户 Notebook 平台建立自助服务分析方案
什么是瞬态集群?解读火山引擎EMR Stateless 的创新理念以及应用
从入门到精通-Fayson带你玩转CDH
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券