腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
星火结构流中RocksDB性能的优化
、
、
、
、
我们正在努力
调
优
RocksDB作为一个状态存储在星火结构化流。通过
火花
的文档,我们有有限的选项提供的星火
调
优
某些设置,例如,启用范围压缩。我想玩一下修改 max_write_buffer_number任何建议都会有帮助。我们是否应该修
浏览 6
提问于2022-11-19
得票数 1
1
回答
火花
内存
调
优
、
、
、
谁能告诉我如何调整
火花
执行器的核心,
内存
,执行器的数量。
浏览 19
提问于2021-11-21
得票数 0
2
回答
哪些因素影响同时有多少
火花
工作?
最近,我们建立了
火花
作业为的submitted.But,我们发现我们的20个节点(每个节点8个核/128 G
内存
)
火花
集群只能提供10个同时运行的
火花
作业。有人能分享一些详细的信息,哪些因素实际上会影响多少
火花
作业可以同时运行?我们如何对conf进行
调
优
,以便充分利用集群?
浏览 3
提问于2016-01-27
得票数 4
回答已采纳
3
回答
如何处理
火花
中的执行器
内存
和驱动程序
内存
?
、
我对处理
火花
中的执行者
内存
和驱动程序
内存
感到困惑。我的环境设置如下: 对于简单的开发,我使用spark-submit以独立集群模式(8个工作人员、20个内核、45.3G
内存
)执行我的Python代码。现在,我想设置执行器
内存
或驱动程序
内存
进行性能
浏览 3
提问于2014-11-28
得票数 51
回答已采纳
1
回答
如何将spark.ml管道拟合和超参数优化集成在AWS中?
、
、
我需要使用
火花
计算后端的原因是,使用当前数据集的培训不再适合
内存
。 我希望使用SageMaker培训作业设置,这样我就可以使用SM超参数优化工作来为LightGBM找到最佳的超级参数。虽然LightGBM
火花
接口本身确实提供了一些超参数
调
优
功能,但它不提供贝叶斯HP
调
优
。现在,我知道了在SM中运行自定义培训的一般方法:以某种方式构建一个容器,然后从ECR中提取它,并通过sagemaker.Estimator 启动一个培训作业/超参数
调
<e
浏览 3
提问于2022-01-24
得票数 2
回答已采纳
1
回答
火花
流作业的巨大延迟
、
、
、
我有一个几乎实时的
火花
流应用,用于图像识别,其中接收器从卡夫卡获得输入帧。我有6个接收器每个执行者,5个执行者在总数,我可以看到30个活动任务每次迭代在星火UI。有了每个任务的流程流,处理单个任务的总延迟就会出现在10到15秒之间,这对于
火花
流应用程序来说是巨大的。 选项2-中断顺序处理,并将每个子进程放在单独的RDD中,即RDD1中的模型#1处理,RDD2中的模型#2处理,等等。
浏览 0
提问于2018-03-04
得票数 1
1
回答
配置执行器
内存
和每个工作节点的执行器数量
、
如何在星盘集群中配置执行器的
内存
。此外,如何配置每个员工节点的执行器数量? 有没有办法知道有多少执行者的
内存
是自由的缓存或持久化新的RDD的。
浏览 4
提问于2015-03-11
得票数 2
回答已采纳
1
回答
hyperopt --在星火环境下并行
调
优
超参数时在hyperopt上使用SparkTrials的问题(数据库库)
、
、
在
调
优
超参数时,我尝试使用hyperopt的sparkTrials函数来并行更快地
调
优
它们,但是错误继续发生。错误是。
浏览 5
提问于2022-05-12
得票数 0
2
回答
用Azure数据库编写
火花
数据
、
、
我的输出
火花
数据由三列组成,列有120000000行。我共享的集群大小是9节点集群,每个节点的
内存
为56 My。 我的怀疑是:- 1.)它在蓝色数据库中的行为是否具有缓慢的写入能力。2.)我们确实不能在azure databricks中
调
优
火花
配置,azure databricks用可用
内存
来调整自身。
浏览 0
提问于2020-11-09
得票数 1
回答已采纳
1
回答
Alter用于在Hive外部表上添加需要很长时间的分区
、
、
、
、
我正试图通过带有6个节点的EMR集群(每个节点上有8个核心和56GB
内存
)来执行
火花
作业。Spark作业对Hive表上的分区进行增量加载,最后执行刷新表以更新元数据。使用的
火花
配置: 调整
火花
核心/
内存
/执行器,但没有运气
浏览 0
提问于2020-10-23
得票数 0
1
回答
用鲨鱼查询卡桑德拉需要花费太多的时间
、
、
、
421.189 seconds我试图通过更改/opt/ shark /shark/conf/shark-env.sh中的一些参数(增加: SPARK_MEM和SHARK_MASTER_MEM)来
调
优
鲨鱼以下是我为所涉及的各种软件安装的版本列表:Shark:鲨鱼-0.9.1-bin-cdh4.6.0-fe75a886硬件
浏览 1
提问于2014-06-25
得票数 0
1
回答
在金牛座容器中自动
调
优
jvm
、
、
您可以设置jvm
内存
设置和金牛座,但它完全支持动态
调
优
吗?是否有相对于系统上可用CPU和
内存
数量来
调
优
jvm的设置?不用自己写剧本就好了。 特别是如果我运行金牛座容器,我希望它是可移植的。
浏览 2
提问于2017-11-04
得票数 2
回答已采纳
1
回答
Map转换性能
火花
数据帧与RDD
、
、
、
我有一个四节点hadoop集群(Mapr),每个节点都有40
内存
。我需要在大数据集(5亿行)的一个字段上‘应用’一个函数。
浏览 2
提问于2016-08-24
得票数 1
1
回答
调
优
cloudera导航器
、
我正在尝试
调
优
我的Cloudera Navigator,官方文档只给出了关于Cloudera Navigator元数据服务器
内存
大小的建议。有没有关于Cloudera Navigator
调
优
的完整文档/文章? 谢谢:)
浏览 5
提问于2017-02-27
得票数 0
2
回答
.NET垃圾收集(GC)
调
优
、
、
代码将一个大文档加载到
内存
中,并在循环中处理它。如果我在这个循环中停止(在调试模式下)或添加GC.Collect(),
内存
使用量就会降到70MB以下。 如何
调
优
GC?有没有
调
优
GC的最佳实践?
浏览 1
提问于2010-09-02
得票数 3
回答已采纳
2
回答
火花
Python性能
调
优
、
sc = SparkContext(conf=conf)我想在文档中更好地理解spark.executor.memory 这是否意味着在一个节点上运行的所有进程的累积
内存
不会超过该上限?
浏览 3
提问于2015-01-03
得票数 6
回答已采纳
2
回答
Apache Spark的性能
调
优
我正在做一个项目,在那里我必须调整
火花
的表现。我已经找到了四个最重要的参数,将有助于调整
火花
的性能。
浏览 1
提问于2017-07-07
得票数 4
2
回答
火花
错误:未能将RPC发送到Datanode
、
、
、
、
但是这是一个新的ambari集群,我们认为这篇文章不适合这个特定的问题(我们的ambari集群现在没有
火花
作业)
浏览 2
提问于2018-02-07
得票数 3
2
回答
内存
不足,CPU消耗低
、
、
、
、
我正在尝试
调
优
某种高负载的应用程序,它通过预处理将数据从一个云流到另一个云端。我的应用程序的具体特点是
内存
的广泛使用和较低的CPU消耗。手动触发来自j控制台的“执行GC”将在所有代中清除大量
内存
,因此我假设应用程序中没有
内存
泄漏。我的应用程序是在mesos/马拉松上运行的,所以我尝试用各种GCs (-XX:+UseG1GC;-XX:+UseParallelGC,无需其他
调
优
)在单个虚拟CPU之间切换到多个CPU,并且图片实际上是一样的; 那么,为什么GC不
浏览 3
提问于2017-04-14
得票数 2
回答已采纳
1
回答
如何在
内存
中保存完整的Solr索引?
、
、
、
、
有关Solr
调
优
的文章(如、或)谈到了缓存和JVM
调
优
。但我感兴趣的是如何配置Solr以在
内存
中保存完整的索引(就像
内存
中的数据库一样)。
浏览 0
提问于2015-07-30
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Java内存性能调优步骤
Spark的内存管理和调优机制
深度学习参数怎么调优、遗传算法与深度学习的火花
Hadoop进级教程之-HBase高可用部署及内存调优
PySpark调优
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券