腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8945)
视频
沙龙
3
回答
为什么ARM异常中
预
取中止和数据中止的返回地址不同?
、
对于
预
取,返回地址是: R14_abt =中止
指令
的地址+4 对于数据中止,返回地址是: R14_abt =中止
指令
的地址+8
浏览 4
提问于2011-06-09
得票数 7
4
回答
ARM上的
预
取
指令
、
、
较新的ARM
处理器
包括PLD和PLI
指令
。如何在
C
++代码中包含显式
预
取
指令
?
浏览 5
提问于2008-09-17
得票数 4
回答已采纳
3
回答
英特尔酷睿2双核
预
取
、
、
有没有人有使用Core 2 Duo
处理器
预
取
指令
的经验? 我一直在使用(标准?)
预
取设置(prefetchnta,prefetcht1等)成功用于一系列P4机器,但当在Core2 Duo上运行代码时,prefetcht(i)
指令
似乎什么也不做,并且prefetchnta
指令
效率较低英特尔是否引入了新的
预
取
指令
?
浏览 2
提问于2009-11-16
得票数 5
4
回答
如何编写在现代x64
处理器
上高效运行的自修改代码?
、
、
、
、
11.6自修改代码 对当前缓存在
处理器
中的代码段中的内存位置的写入导致关联的缓存行(或多行)失效。此检查基于
指令
的物理地址。此外,P6系列和奔腾
处理器
检查对代码段的写入是否可以修改已
预
取以执行的
指令
。如果写入影响
预
取
指令
,则
预
取队列无效。后一种检查是基于
指令
的线性地址。对于奔腾4和Intel Xeon
处理器
,代码段中
指令
的写入或窥探(目标
指令
已经解码并驻留在跟踪缓存中)使整个跟踪缓
浏览 7
提问于2013-07-19
得票数 14
1
回答
有没有办法在
C
#的代码中修改Visual Studio2008或2010项目的
预
构建事件?
、
、
、
有没有办法在
C
#的代码中修改Visual Studio2008或2010项目的
预
构建事件?
C
#是否有这样的预
处理器
指令
,允许用户在项目编译和构建之前配置要运行的内容?这样做的目的是扫描项目中的着色器效果文件(.fx)并重新编译它们,而无需在每次添加新的着色器效果文件时手动编辑
预
构建事件。如果你知道任何有利于这个场景的东西,我们非常欢迎你的贡献。
浏览 0
提问于2010-06-09
得票数 4
回答已采纳
1
回答
预
取命令的汇编用法
、
、
我正在写一些(arm)内联汇编代码,这些代码在一个循环中处理大量的
C
结构,并将一些数据存储到另一个数组中。在目标数组中
预
取地址也有意义吗? 谢谢!
浏览 0
提问于2010-01-28
得票数 2
1
回答
如何确认艾根正在视觉工作室中支持矢量化?如何检查是否定义了EIGEN_VECTORIZE预处理符号?
、
、
根据的说法,特征“如果检测到支持的SIMD
指令
集和支持的编译器,将自动启用其矢量化”。我在项目->属性->配置属性->
C
/
C
++->优化中打开了“最大化速度”标志(/O2) 此外,根据本征
常见问题
,为了检查是否使用向量化,“首先可以检查本征向量化是否启用:然后定义EIGEN_VECTORIZE预
处理器
符号。”如果我查看Project->Properties->Configuration >
C
/
C
++
浏览 2
提问于2019-11-12
得票数 0
4
回答
Intel:串行化
指令
和分支预测
、
、
、
(Vol3A,第8-26节)说: *为澄清而编辑
浏览 6
提问于2011-11-18
得票数 2
回答已采纳
1
回答
如何确定SSE
预
取
指令
大小?
、
、
我正在使用包含SSE
预
取
指令
内联程序集的代码。预
处理器
常量确定是否使用32-、64-或128-拜
预
取
指令
.该应用程序在多种平台上使用,到目前为止,我不得不对每一种情况进行研究,这是给定CPU的最佳选择。据我所知,这是缓存线的大小。
浏览 2
提问于2009-09-04
得票数 3
1
回答
编写一个测量缓存块大小的
C
程序
、
该程序使用sbrk()函数声明大型数组。Sbrk按指定增量更改数据段大小。我正在使用的标准库函数,例如:#include <sys/time.h> 我的main()函数首先声明一个变量: register *a;我的目标是尝试将我在内存访问期间使用的所有变量放入寄存器,因为我唯一想要的内存访问是对数组。如果局部变量驻留在内存中,则访问它们可能会对测量结果产生影响。下一步是分配数组,这是一个由大约400万个整数组成的数组,在32位机器上是16MB。 a=sbrk(4*1
浏览 0
提问于2012-11-28
得票数 2
回答已采纳
1
回答
8088/8086 WAIT
指令
和BIU
、
当8086/8088执行WAIT
指令
时,是整个
处理器
空闲,还是只有EU空闲?英特尔iAPX 86/88用户手册(1981,2.18页)未指定BIU是否也停止
预
取。
浏览 0
提问于2017-04-26
得票数 3
1
回答
ARM7
处理器
何时增加其PC寄存器?
、
、
我在思考这个问题:ARM7(有3条流水线)
处理器
什么时候增加它的PC寄存器。 我原以为一条
指令
执行完后,
处理器
会先检查最后一次执行中是否有异常,然后根据当前状态将PC加2或4。但是在分析返回的
指令
时,这是没有意义的。我不明白为什么PC从未定义的
指令
异常返回时会分配LR,而LR-4从
预
取异常返回时会分配LR,这两个异常不是都发生在解码状态吗?更重要的是,根据我的教科书,当PC从
预
取-中止-异常返回时,无论
处理器
在异常发生前处于什么状态(ARM或Thumb
浏览 0
提问于2010-04-15
得票数 3
回答已采纳
7
回答
分支预测对性能的影响?
、
当我编写一些需要快速工作的紧凑循环时,我经常被关于
处理器
分支预测将如何表现的想法所困扰。例如,我尽量避免在最内层的循环中使用if语句,特别是结果不太一致(随机计算为true或false )的语句。我倾向于这样做,因为有些常识是
处理器
预
取
指令
,如果结果是它错误地预测了一个分支,那么
预
取是无用的。哪些编码模式可以让它变得更好?
浏览 2
提问于2008-11-14
得票数 18
1
回答
在不同
处理器
(x86程序集)上运行代码
、
、
、
、
在x86上的真实模式中,在多
处理器
系统中,在不同的
处理器
上运行代码需要使用哪些
指令
?(我正在汇编程序中编写一些
预
引导代码,这些代码需要设置特定的CPU寄存器,并在实际操作系统启动之前,在系统中的每个CPU上这样做。)
浏览 3
提问于2009-10-25
得票数 10
回答已采纳
1
回答
其他因素对性能有影响吗?把最有可能的情况放在最前面更好
、
、
、
count); public void setup() { byte zeroOrOne = (byte) (
c
< (bias * count) ?
浏览 1
提问于2022-07-15
得票数 6
回答已采纳
3
回答
为什么随机的额外代码会提高性能?
、
、
、
// if (
C
->N[0] ==
C
->N[0]); // this line will speed up execution significantly
C
=
C
->N[u]; } void addNode(Key *key, int value){...};在前缀树(也称为Trie)的实现中,我发现90%的findNode()执行时
浏览 4
提问于2015-07-16
得票数 16
回答已采纳
3
回答
Intel
处理器
的虚拟操作处理
、
、
、
、
基本上,我想知道英特尔
处理器
是否提供了一些特殊的机制来有效地执行一系列虚拟
指令
,即NOP
指令
?例如,我可以想象有某种类型的
预
取机制可以识别NOPS,丢弃它们,并尝试取而代之一些有用的
指令
。或者这些NOPS作为普通
指令
被分派到执行单元,这意味着我可以在每个周期大致处理5个nops (假设有5个执行单元) 谢谢,莱因哈德
浏览 4
提问于2010-01-23
得票数 2
1
回答
缓存
预
取是在硬件地址空间还是在虚拟地址空间完成?
、
、
硬件
预
取器是对连续的虚拟地址进行操作,还是在连续的硬件地址上操作?想象一下,您有一个跨越多个页面的大字节数组。在虚拟地址空间中,字节是连续的,但实际上,在硬件中,页面可以在不相交的页面中分配。我希望
预
取程序能够在TLB开始引入属于下一页的缓存行之前使用TLB进行适当的转换。 是这样吗?我找不到证实这一点的信息,希望有人能给我更多的洞察力。
浏览 0
提问于2017-03-23
得票数 7
回答已采纳
2
回答
有没有办法避开
C
预
处理器
指令
?
、
、
、
我要做的是让
C
预
处理器
输出#ifdef、#else和#endif
指令
。也就是说,我想以某种方式“转义”一条
指令
,以便预
处理器
的输出包括该
指令
,从而使预
处理器
在输出上运行。是否有可能“转义”CPP
指令
,使其由预
处理器
输出,从而如果CPP输出本身进行预处理,则转义
指令
的输出将成为预
处理器
指令
?
浏览 0
提问于2011-10-07
得票数 9
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
复合指令集核心处理器的设计简析
C+编程中常见问题与解决途径
微软&清华提出全新预训练范式,指令预训练让8B模型实力暴涨!实力碾压70B模型
芯片指令集国产替代AMD出现,字眼16核处理器实现流片
C语言学习——指针的一些常见问题
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券