腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4083)
视频
沙龙
1
回答
英特尔
至强
CPU
如何
处理
争
用
AVX
单元
的
内核
?
、
、
我正在设计一个信号
处理
应用程序,用于运行使用linux
的
Intel Xeon
CPU
。它将有几个并行线程,每个线程都分配给它自己
的
核心。每一个都将使用IPP库来加速使用
AVX
单位
的
计算。如果我运行更多与
AVX
单元
相关
的
线程,那么会发生什么?线程会一直阻塞到
AVX
单元
可用吗?它们能以某种方式分享吗?更险恶
的
东西?
浏览 31
提问于2020-09-10
得票数 1
1
回答
哪些硬件在
英特尔
酷睿
处理
器上运行OpenCL?
、
、
我正在考虑通过在
英特尔
i7平台上结合OpenCL和
AVX
来实现并行
的
机会,但我不认为这是可能
的
。虽然,我知道
CPU
和iGPU共享相同
的
内存带宽,但我不确定它们是否共享其他硬件?open OpenCL是否在iGPU (“
英特尔
图形
处理
器”)或
AVX
单元
("
CPU
核心“)上运行?
浏览 16
提问于2017-03-17
得票数 1
回答已采纳
1
回答
调度程序未考虑OpenCL子设备亲和性
、
、
、
、
我正在尝试编写一个在特定
CPU
上执行
内核
的
OpenCL概念证明应用程序(因此将来可以扩展为支持NUMA,并为相应
的
NUMA节点上
的
内核
执行分配内存,正如所指出
的
那样)。不幸
的
是,Windows调度器并不关心我想要什么,因为它似乎通过所有可用
的
CPU
核心来循环我
的
内核
(从而远离本地内存)。尽管如此,当我观察Windows
的
CPU
使用率时,并不是单个
浏览 0
提问于2015-01-03
得票数 2
1
回答
TensorFlow库未编译为使用SSE4.1、SSE4.2、
AVX
、
AVX
2指令来加速
CPU
计算
、
、
、
我只有
英特尔
(R)
至强
(R)CPUE5-2640 v4 @2.40
cpu
型号
的
CPU
机。我需要加快运行tensorflow代码所用
的
时间。tensorflow/core/platform/
cpu
_feature_guard.cc:45] The TensorFlow library wasn't compiled to use
AVX
instructionstensorflow/core/
浏览 0
提问于2020-07-23
得票数 0
2
回答
ArrayFire AF_BACKEND_
CPU
不是多线程
的
吗?
我在我
的
OpenCL
处理
器上使用了
英特尔
的
i7。当我切换到AF_BACKEND_
CPU
后端时,我
的
代码大约慢了10-15倍。我检查了一下,注意到它只运行在一个核心上。我还怀疑,它没有使用SSE或
AVX
指令,因为我
的
处理
器只有4个
内核
,而
AVX
指令是减速
的
原因。我觉得ArrayFire
的
后端应该更快。有没有办法让它成为多线程
的
?
浏览 3
提问于2016-03-30
得票数 1
回答已采纳
5
回答
亚马逊EC2计算
单元
和谷歌计算引擎
单元
、
所以谷歌现在有了自己
的
名为
的
IaaS解决方案。有没有人能更深入地了解这两者之间
的
区别?答:看起来像1GCEU ~= 1 EC2计算
单元
。下面是接受答案
的
更多信息。
浏览 1
提问于2012-06-29
得票数 15
回答已采纳
1
回答
AVX
512未在
英特尔
Tensorflow上显示
、
、
、
我
用
Python3.10创建了一个conda环境,并运行了pip install intel-tensorflow。它提到在PIP车轮上自动使用和启用
AVX
512: 所有
英特尔
TensorFlow二进制文件都是使用oneAPI深层神经网络库(oneDNN)进行优化
的
,该库将在性能关键操作中自动使用
AVX
2或
AVX
512FFMA等
CPU
指令,这是基于您
的
机器上支持
的
用于Windows和Linux
的
指令集。因此,我不确
浏览 21
提问于2022-07-19
得票数 1
2
回答
AVX
中
的
散射内部函数
、
、
我在
英特尔
内部指南2.7版中找不到它们。你知道
AVX
或
AVX
2指令集是否支持它们吗?
浏览 1
提问于2012-12-24
得票数 14
回答已采纳
3
回答
哪些
CPU
支持MOVBE指令?
、
、
是否每个
英特尔
凌动
CPU
都支持MOVBE? 还有哪些
处理
器支持这条指令?我似乎在
英特尔
网站上找不到此信息。请帮帮忙。
浏览 4
提问于2011-03-09
得票数 13
回答已采纳
2
回答
使用Intel C++编译器2019.4编译
的
简单控制台应用程序不运行在Ryzen
处理
器上。
、
、
、
、
\n" );当使用Intel C++编译器2019.4编译时,使用以下开关:/O3 /Qunroll /Qunroll-aggressive /QxSSE3 /QaxCORE-
AVX
2拒绝在运行Windows10
的
Ryzen31200
处理
器上运行。我在控制台上遇到
的
错误是运行应用程序所需
的
处理
器特性列表。所有这些特性都可以在Ryzen
处理
器(SSE3、
AVX
2、CMOV、FXSAVE等)
浏览 0
提问于2019-07-14
得票数 2
2
回答
为什么冰湖没有像特雷蒙特那样
的
MOVDIRx?他们已经有更好
的
了吗?
、
、
、
、
我注意到Intel Tremont有64字节
的
存储指令和和。我在MOVDIRx中没有发现IceLake。为什么冰湖不需要像MOVDIRx这样
的
指示Intel ArchitectureInstruction集扩展和未来
的
FeaturesProgramming参考
浏览 2
提问于2019-02-28
得票数 7
回答已采纳
1
回答
Python多
处理
-针对双核、四核和六核cpus
的
编码
、
我有一个关于Python多
处理
的
快速问题。我正在写一些代码,它将使用多
处理
在
内核
/虚拟
内核
之间拆分任务,但我有许多机器,每台机器都有不同
的
CPU
…… 我有一个
英特尔
Centrino2双核,一个
英特尔
i5四核和一个双
至强
十六核(带有超线程),可以运行这些代码这意味着每台机器将有2个、4个或12/24个
内核
,我想知道是否相同
的
代码可以在所有机器上运行,或者我是否需要
浏览 23
提问于2017-03-01
得票数 1
回答已采纳
1
回答
在OpenCL C中计算
内核
代码
的
运行时间
、
、
、
、
我想测量
内核
代码在不同设备上
的
性能(读取运行时),即
CPU
和GPU。我写
的
内核
代码是:{ A[0]=2; A[1]=3;如果这是真的,那么谁能给出原因,如果不是,请告诉我实现同样
的
方法。此外,正如我所说
的
,我希望比较我
的
CPU
和GPU
的
性能,其中一种方法是通过计算
内核</
浏览 0
提问于2015-07-04
得票数 0
3
回答
AVX
/
AVX
2是否存在于每个核心上?
、
、
、
、
那么,这个
AVX
的
东西-它就像一个小机器为每个核心?还是整个
CPU
只需要一个引擎
单元
?你能解释一下吗?
浏览 0
提问于2021-02-20
得票数 3
回答已采纳
1
回答
如何
在linux
内核
中启用Intel AES-NI支持
如何
在linux
内核
中启用AES-NI支持。在互联网上搜索时,我发现一旦启用AES-NI,
内核
配置文件中应该有一行"CONFIG_CRYPTO_AES_NI_INTEL=m“。我尝试重新编译我
的
内核
版本2.6.35.6,但是没有成功。我
的
服务器硬件配置是(超微6026T、
英特尔
®
至强
®
处理
器E5640),支持AES-NI。 向lalit致以亲切
的
问候
浏览 4
提问于2010-12-30
得票数 2
2
回答
CPU
/Intel OpenCL性能问题,实现问题
、
、
、
、
已经在
处理
OpenMP和OpenCL性能之间
的
差异,但它没有回答我
的
问题。目前,我面临以下问题: 1)拥有“矢量化
内核
”(就Intel离线编译器而言)真的很重要吗?向量化
内核
意味着通过使用SIMD指令,您可以在一个
CPU
线程中执行4 (SSE)或8 (
AVX
) OpenCL“逻辑”线程。只有当所有数据连续存储在内存中时,才能实现这一点。我认为我
的
问题
的
答案在于内存带宽。可能矢量寄存器更适合有效
的
内存访问。在这种情况下
浏览 1
提问于2012-11-15
得票数 10
回答已采纳
1
回答
nat工作台是
如何
工作
的
?我使用nats bench达到30,34TB,但我不明白为什么
我是NATS
的
新手,我第一次使用nats-bench来测试NATSPub stats: 20,848,474 msgs/sec ~ 30.34 TB/sec我
的
电脑设置:“
英特尔
(R)
至强
浏览 3
提问于2019-12-23
得票数 1
2
回答
使用带spark
的
英特尔
AVX
、
、
、
、
我们有了一个采用
英特尔
AVX
512
CPU
的
新集群。我们对这个问题进行了研究,但没有结果。我们想知道spark作业是否能够在
AVX
本地运行以
处理
DataFrames对象,或者我们是否必须更改代码才能允许JVM使用它,或者它是否完全无用。我们
的
spark应用是
用
scala编写
的
。我们
的
大部分工作都是DataFrames对象
处理
和算法。提前感谢您
的
帮助
浏览 33
提问于2019-03-01
得票数 3
回答已采纳
1
回答
在Intel Xeon Phi上使用OpenCL进行并发模拟
、
、
、
、
我有一个OpenCL应用程序,它未充分利用
英特尔
至强
Phi
的
功能。有什么建议吗?
浏览 5
提问于2016-04-11
得票数 0
1
回答
我
如何
使所有的
英特尔
内在选择GCC?
、
、
参考GCC内置
的
函数:是否有允许所有这些
的
标志选项?
浏览 0
提问于2021-11-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
英特尔推出Xeon E-2100系列,预览Cascade Lake
大数据技术演进实录:云原生大数据、湖仓一体、AI for Data,未来“谁主沉浮”?
详解服务器处理器基础知识
英特尔宣布推出Cascade Lake Xeons:每个插槽48个内核和12个通道内存
幽灵/系统修复对Linux内核影响有多大?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券