英特尔至强CPU如何处理争用AVX单元的内核？

、、

我正在设计一个信号处理应用程序，用于运行使用linux的Intel Xeon CPU。它将有几个并行线程，每个线程都分配给它自己的核心。每一个都将使用IPP库来加速使用AVX单位的计算。如果我运行更多与AVX单元相关的线程，那么会发生什么？线程会一直阻塞到AVX单元可用吗？它们能以某种方式分享吗？更险恶的东西？

浏览 31提问于2020-09-10得票数 1

1回答

哪些硬件在英特尔酷睿处理器上运行OpenCL？

、、

我正在考虑通过在英特尔i7平台上结合OpenCL和AVX来实现并行的机会，但我不认为这是可能的。虽然，我知道CPU和iGPU共享相同的内存带宽，但我不确定它们是否共享其他硬件？open OpenCL是否在iGPU (“英特尔图形处理器”)或AVX单元("CPU核心“)上运行？

浏览 16提问于2017-03-17得票数 1

回答已采纳

1回答

调度程序未考虑OpenCL子设备亲和性

、、、、

我正在尝试编写一个在特定CPU上执行内核的OpenCL概念证明应用程序(因此将来可以扩展为支持NUMA，并为相应的NUMA节点上的内核执行分配内存，正如所指出的那样)。不幸的是，Windows调度器并不关心我想要什么，因为它似乎通过所有可用的CPU核心来循环我的内核(从而远离本地内存)。尽管如此，当我观察Windows的CPU使用率时，并不是单个

浏览 0提问于2015-01-03得票数 2

1回答

TensorFlow库未编译为使用SSE4.1、SSE4.2、AVX、AVX2指令来加速CPU计算

、、、

我只有英特尔(R)至强(R)CPUE5-2640 v4 @2.40 cpu型号的CPU机。我需要加快运行tensorflow代码所用的时间。tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use AVX instructionstensorflow/core/

浏览 0提问于2020-07-23得票数 0

2回答

ArrayFire AF_BACKEND_CPU不是多线程的吗？

我在我的OpenCL处理器上使用了英特尔的i7。当我切换到AF_BACKEND_CPU后端时，我的代码大约慢了10-15倍。我检查了一下，注意到它只运行在一个核心上。我还怀疑，它没有使用SSE或AVX指令，因为我的处理器只有4个内核，而AVX指令是减速的原因。我觉得ArrayFire的后端应该更快。有没有办法让它成为多线程的？

浏览 3提问于2016-03-30得票数 1

回答已采纳

5回答

亚马逊EC2计算单元和谷歌计算引擎单元

、

所以谷歌现在有了自己的名为的IaaS解决方案。有没有人能更深入地了解这两者之间的区别？答:看起来像1GCEU ~= 1 EC2计算单元。下面是接受答案的更多信息。

浏览 1提问于2012-06-29得票数 15

回答已采纳

1回答

AVX512未在英特尔Tensorflow上显示

、、、

我用Python3.10创建了一个conda环境，并运行了pip install intel-tensorflow。它提到在PIP车轮上自动使用和启用AVX512：所有英特尔TensorFlow二进制文件都是使用oneAPI深层神经网络库(oneDNN)进行优化的，该库将在性能关键操作中自动使用AVX2或AVX512FFMA等CPU指令，这是基于您的机器上支持的用于Windows和Linux的指令集。因此，我不确

浏览 21提问于2022-07-19得票数 1

2回答

AVX中的散射内部函数

、、

我在英特尔内部指南2.7版中找不到它们。你知道AVX或AVX2指令集是否支持它们吗？

浏览 1提问于2012-12-24得票数 14

回答已采纳

3回答

哪些CPU支持MOVBE指令？

、、

是否每个英特尔凌动CPU都支持MOVBE？还有哪些处理器支持这条指令？我似乎在英特尔网站上找不到此信息。请帮帮忙。

浏览 4提问于2011-03-09得票数 13

回答已采纳

2回答

使用Intel C++编译器2019.4编译的简单控制台应用程序不运行在Ryzen处理器上。

、、、、

\n" );当使用Intel C++编译器2019.4编译时，使用以下开关：/O3 /Qunroll /Qunroll-aggressive /QxSSE3 /QaxCORE-AVX2拒绝在运行Windows10的Ryzen31200处理器上运行。我在控制台上遇到的错误是运行应用程序所需的处理器特性列表。所有这些特性都可以在Ryzen处理器(SSE3、AVX2、CMOV、FXSAVE等)

浏览 0提问于2019-07-14得票数 2

2回答

为什么冰湖没有像特雷蒙特那样的MOVDIRx？他们已经有更好的了吗？

、、、、

我注意到Intel Tremont有64字节的存储指令和和。我在MOVDIRx中没有发现IceLake。为什么冰湖不需要像MOVDIRx这样的指示Intel ArchitectureInstruction集扩展和未来的FeaturesProgramming参考

浏览 2提问于2019-02-28得票数 7

回答已采纳

1回答

Python多处理-针对双核、四核和六核cpus的编码

、

我有一个关于Python多处理的快速问题。我正在写一些代码，它将使用多处理在内核/虚拟内核之间拆分任务，但我有许多机器，每台机器都有不同的CPU…… 我有一个英特尔Centrino2双核，一个英特尔i5四核和一个双至强十六核(带有超线程)，可以运行这些代码这意味着每台机器将有2个、4个或12/24个内核，我想知道是否相同的代码可以在所有机器上运行，或者我是否需要

浏览 23提问于2017-03-01得票数 1

回答已采纳

1回答

在OpenCL C中计算内核代码的运行时间

、、、、

我想测量内核代码在不同设备上的性能(读取运行时)，即CPU和GPU。我写的内核代码是：{ A[0]=2; A[1]=3;如果这是真的，那么谁能给出原因，如果不是，请告诉我实现同样的方法。此外，正如我所说的，我希望比较我的CPU和GPU的性能，其中一种方法是通过计算内核</

浏览 0提问于2015-07-04得票数 0

3回答

AVX/AVX 2是否存在于每个核心上？

、、、、

那么，这个AVX的东西-它就像一个小机器为每个核心？还是整个CPU只需要一个引擎单元？你能解释一下吗？

浏览 0提问于2021-02-20得票数 3

回答已采纳

1回答

如何在linux内核中启用Intel AES-NI支持

如何在linux内核中启用AES-NI支持。在互联网上搜索时，我发现一旦启用AES-NI，内核配置文件中应该有一行"CONFIG_CRYPTO_AES_NI_INTEL=m“。我尝试重新编译我的内核版本2.6.35.6，但是没有成功。我的服务器硬件配置是(超微6026T、英特尔®至强®处理器E5640)，支持AES-NI。向lalit致以亲切的问候

浏览 4提问于2010-12-30得票数 2

2回答

CPU/Intel OpenCL性能问题，实现问题

、、、、

已经在处理OpenMP和OpenCL性能之间的差异，但它没有回答我的问题。目前，我面临以下问题： 1)拥有“矢量化内核”(就Intel离线编译器而言)真的很重要吗？向量化内核意味着通过使用SIMD指令，您可以在一个CPU线程中执行4 (SSE)或8 (AVX) OpenCL“逻辑”线程。只有当所有数据连续存储在内存中时，才能实现这一点。我认为我的问题的答案在于内存带宽。可能矢量寄存器更适合有效的内存访问。在这种情况下

浏览 1提问于2012-11-15得票数 10

回答已采纳

1回答

nat工作台是如何工作的？我使用nats bench达到30,34TB，但我不明白为什么

我是NATS的新手，我第一次使用nats-bench来测试NATSPub stats: 20,848,474 msgs/sec ~ 30.34 TB/sec我的电脑设置：“英特尔(R)至强

浏览 3提问于2019-12-23得票数 1

2回答

使用带spark的英特尔AVX

、、、、

我们有了一个采用英特尔AVX 512 CPU的新集群。我们对这个问题进行了研究，但没有结果。我们想知道spark作业是否能够在AVX本地运行以处理DataFrames对象，或者我们是否必须更改代码才能允许JVM使用它，或者它是否完全无用。我们的spark应用是用scala编写的。我们的大部分工作都是DataFrames对象处理和算法。提前感谢您的帮助

浏览 33提问于2019-03-01得票数 3

回答已采纳

1回答

在Intel Xeon Phi上使用OpenCL进行并发模拟

、、、、

我有一个OpenCL应用程序，它未充分利用英特尔至强Phi的功能。有什么建议吗？

浏览 5提问于2016-04-11得票数 0

1回答

我如何使所有的英特尔内在选择GCC？

、、

参考GCC内置的函数：是否有允许所有这些的标志选项？

浏览 0提问于2021-11-02得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

哪些硬件在英特尔酷睿处理器上运行OpenCL？

调度程序未考虑OpenCL子设备亲和性

TensorFlow库未编译为使用SSE4.1、SSE4.2、AVX、AVX2指令来加速CPU计算

ArrayFire AF_BACKEND_CPU不是多线程的吗？

亚马逊EC2计算单元和谷歌计算引擎单元

AVX512未在英特尔Tensorflow上显示

AVX中的散射内部函数

哪些CPU支持MOVBE指令？

使用Intel C++编译器2019.4编译的简单控制台应用程序不运行在Ryzen处理器上。

为什么冰湖没有像特雷蒙特那样的MOVDIRx？他们已经有更好的了吗？

Python多处理-针对双核、四核和六核cpus的编码

在OpenCL C中计算内核代码的运行时间

AVX/AVX 2是否存在于每个核心上？

如何在linux内核中启用Intel AES-NI支持

CPU/Intel OpenCL性能问题，实现问题

nat工作台是如何工作的？我使用nats bench达到30,34TB，但我不明白为什么

使用带spark的英特尔AVX

在Intel Xeon Phi上使用OpenCL进行并发模拟

我如何使所有的英特尔内在选择GCC？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐