腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
我
可以
测量
ML.api
在
Spark
中
的
并行
性能
吗
?
、
、
、
一般来说,
我
想用相同
的
学习算法
在
Spark
中比较大型数据集和拆分数据集之间
的
计算时间。另一个原因是
我
想得到分区模型
的
结果。如何调整参数才能得到想要
的
结果? 或者
我
可以
停下来使用
Spark
<em
浏览 3
提问于2016-08-25
得票数 0
2
回答
Apache
Spark
中
的
CPU使用率是否有限?
、
、
我
最近发现,
在
UDF
中
添加
并行
计算(例如使用
并行
集合)
可以
显著提高
性能
,即使
在
local[1]模式下运行
spark
或使用具有一个执行器和一个核心
的
Yarn时也是如此。例如,
在
local[1]模式下,
Spark
-Jobs会消耗尽可能多
的
CPU (即,如果
我
有8个核心,使用top
测量
,则为800% )。这似乎很奇怪,因为
我<
浏览 6
提问于2017-03-06
得票数 4
3
回答
纯C OpenCL与Python OpenCL
性能
、
、
、
、
我
正在寻找OpenCL和Pure
的
Python包装器之间
的
性能
度量。
性能
测量
可以
随时间、内存等而变化。-是否有基准?-对时间
性能
差异
的
期望是什么?-什么样
的
任务(当然是
并行
的
.)会有什么不同
吗
?
浏览 3
提问于2014-04-29
得票数 0
回答已采纳
1
回答
如果数据适合于一台机器,那么使用星火是否有意义?
、
、
我
有20 my
的
数据需要处理,所有这些数据都适合
我
的
本地机器。
我
计划使用
Spark
或Scala
并行
学院来实现对这些数据
的
一些算法和矩阵乘法。既然数据适合于一台机器,那么
我
应该使用Scala
并行
集合
吗
?这是真的
吗
:
并行
任务
中
的
主要瓶颈是将数据送到CPU进行处理,所以既然所有数据都尽可能接近CPU,那么
Spark
将
浏览 0
提问于2014-05-28
得票数 7
回答已采纳
1
回答
从
spark
中
的
sql server
并行
读取
、
、
我
正在使用com.microsoft.sqlserver.jdbc.SQLServerDriver
在
spark
作业
中
从sql server读取数据。为了提高
性能
,需要
并行
读取数据。
spark
job建立
的
连接数是否等于
spark
-submit命令
中
的
核心数?
浏览 0
提问于2019-06-28
得票数 1
1
回答
Spark
Direct Stream没有为每个kafka分区创建
并行
流
、
我们
在
集成
Spark
-Kafka streams时遇到了
性能
问题。项目设置:我们使用3个分区
的
Kafka主题,每个分区产生3000条消息,并在
Spark
direct streaming中进行处理。我们面临
的
问题是:
在
处理端,我们使用
Spark
直接流方法来处理相同
的
内容。如以下文档所示。
Spark
应该创建与主题中
的
分区数量相同
的
并行
直接流(
在
本例
浏览 3
提问于2016-12-08
得票数 5
1
回答
测试具有长期运行查询
的
,这些查询被轮询状态。
、
、
、
、
我
很难找到一个框架来帮助我测试
我
正在编写
的
服务
的
性能
,这个服务有一个长期运行
的
过程。对服务
的
一个简化描述是: 从/ results /{token}获取结果。
我
已经接触过Locust.io,它
可以
很好
浏览 2
提问于2020-06-03
得票数 0
3
回答
如何判断
我
的
C++程序
中
的
OpenMP是否正常工作
、
、
我
正在使用OpenMP对
我
的
嵌套循环进行多线程处理。因为
我
刚接触这个东西,所以我不确定
我
是否以正确
的
方式使用了OpenMP,这样它才能真正地进行
并行
编程。所以我想知道
我
是否
可以
测量
我
的
使用OpenMP
的
C++程序
的
性能
,这样
我
就
可以
知道它实际上是有效
的
,
我
是
浏览 2
提问于2009-08-19
得票数 6
回答已采纳
1
回答
星火中
的
准等位基因收藏
、
、
星火中
的
“平行集合”
的
概念是什么,以及这个概念如何能够提高工作
的
整体
性能
?此外,应该如何配置分区呢?
浏览 3
提问于2018-05-05
得票数 1
回答已采纳
1
回答
从单个数据源
并行
运行代码
、
、
我
写了一个sparkjob,它从hdfs
中
获取parquet格式
的
数据。现在,
我
想根据设备类型区分执行
的
代码,并为每个设备所有者执行代码。查看日志时,代码是按顺序执行
的
,而不是
并行
执行
的
。
我
在
没有改变执行时间
的
情况下尝试了不同
的
#worker#core内存组合数量。 在我看来,应该
可以
有n*m个
并行
执行,其中n是设备
的
数量,m是
浏览 18
提问于2019-06-12
得票数 0
1
回答
Java HotSpot中共享内存文件空间不足
的
影响是什么?
、
、
、
、
我
已经运行了许多实验( cpu时间
的
几个月),
在
日志中有以下警告:
在
Java HotSpot中共享内存文件空间不足
的
影响是什么?
我
所发现
的
关于共享内存文件
的
全部内容是。从这一点来看,共享内存文件
的
缺乏似乎对
我<
浏览 4
提问于2015-07-27
得票数 5
回答已采纳
1
回答
并行
火花收集功能
、
、
我
注意到
spark
的
函数,collect
在
大数据集上速度非常慢,所以我尝试使用
并行
化来修复这个问题。
spark
= SparkSession.builder.appName('app_name').getOrCreate()这里是
我
尝试
并行</
浏览 4
提问于2019-09-19
得票数 0
1
回答
多平台
性能
分析
、
、
、
我
已经写了一个程序,它在两种模式下运行,顺序和多线程,目的是
在
多个处理器体系结构上运行它,然后分析处理器
的
性能
并比较它们。 有什么工具
可以
帮我做到这一点
吗
??
我
已经有了使用gprof进行代码分析
的
基本知识,
我
相信这是不够
的
。
我
正在寻找
的
东西是相同
的
想法,但更强大!有什么帮助
吗
??
浏览 5
提问于2013-05-06
得票数 1
回答已采纳
1
回答
星星之火:
并行
洗牌=1
、
我
只
在
一个具有
Spark
的
节点上运行Parallelism = 1,以便将其
性能
与单线程应用程序进行比较。
我
想知道
Spark
是否仍然
在
使用Shuffle,尽管它不是
并行
运行
的
。counts = text_file.flatMap(line => line.split(" ")) .reduceByKey(_+_)
我<
浏览 1
提问于2015-12-13
得票数 3
回答已采纳
3
回答
Spark
Cassandra
性能
问题
、
、
我
是
Spark
和Cassandra
的
新手。
我
面临着一个主要
的
性能
问题,
我
在
Spark
中
每隔5秒流式传输来自Kafka
的
数据,然后使用JRI对R语言中
的
数据进行分析,最后将数据保存到Cassandra各自
的
列族
中
。将数据保存到Cassandra
的
持续时间(以毫秒为单位)随着输入请求
的
数量增加非常快,每个请求为20
浏览 0
提问于2015-11-10
得票数 0
1
回答
Linux内核
在
压力下有更好
的
响应时间
、
、
、
我
有一个
我
无法理解
的
奇怪行为:出于
性能
测量
的
目的,
我
使用‘旧
的
’
并行
端口接口
在
debian内核3.2.0-4-amd64上生成IRQ(
我
使用一个连接到ACK引脚
的
外部信号发生器)。
我
编写了自己
的
内核模块(仅上半部分)来处理中断,并将外部信号发送回
并行
端口,并在示波器上显示这两个信号,以便
我
可以
浏览 3
提问于2013-11-06
得票数 4
2
回答
在
Unity3d中使O(1)函数成为协程是否值得?
、
、
我
有两个函数,Foo()和Bar()。是否值得将Foo作为一个协程来获得一些加速?
浏览 11
提问于2016-08-09
得票数 0
回答已采纳
2
回答
php页面的等待时间
、
、
我
正在调试ajax应用程序
的
性能
问题。 Firefox开发人员工具显示等待时间约为3秒。如果
我
尝试通过getrusage() 'ru_utime.tv_sec‘和'ru_utime.tv_usec’来
测量
php脚本,
我
在
脚本开始处随机得到0.2到9秒,脚本开始和结束之间
的
差异大约是0.07那么
我
该如何解释这些结果呢?这是否意味着php代码本身运行0.07秒,其余时间用于sql查询等?(
我
的
浏览 2
提问于2017-06-16
得票数 2
1
回答
什么时候使用Scala Futures?
、
、
、
、
我
是
spark
Scala程序员。
我
有一个火花工作,有子任务,以完成整个工作。
我
想使用to Futures来
并行
完成子任务。一旦完成整个工作,
我
必须返回整个工作
的
回应。关于scala Futures,
我
听说一旦主线程执行并停止,剩下
的
线程就会被杀死,你也会得到空
的
响应。
我
必须使用Await.result来收集结果。但是所有的博客都告诉你应该避免使用Await.result,这是一种糟糕
的<
浏览 16
提问于2019-09-20
得票数 0
1
回答
有选择地记录内核Ftrace点以获取特定参数
、
、
、
、
我
想使用Ftrace来
测量
一些内核函数
的
性能
,但我想有选择地
测量
参数
的
特定值。这是因为调用相同函数(但参数不同)
的
相同/其他程序污染了
我
的
Ftrace输出日志。另外,
我
不想设置PID过滤器,因为它不会解决
我
的
问题(
我
正在运行多个
并行
内核线程,并且同一个程序也
可以
使用不同
的
参数调用该函数)。
在<
浏览 38
提问于2021-05-08
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券