腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
sqrt和div
指令
以相同
的
速度运行
、
、
、
我偶然阅读了英特尔体系结构参考手册,当我阅读
指令
延迟和吞吐量附录时,我发现延迟(执行核心完成所有形成
指令
的
μ操作
的
执行所需
的
时钟
周期
数)。sqrt
指令
的
延迟与divide (在
C
-28页)
指令
的
延迟完全相同--至少对于某些微体系结构是这样。对于单精度、双精度和扩展精度,这些数字分别为30、40和44个时钟
周期
。我
的
问题是,一条sqrt
指令
怎么能像
浏览 4
提问于2013-02-16
得票数 2
回答已采纳
1
回答
排出英特尔酷睿2 Duo
的
指令
流水线?
、
、
、
、
我正在用
C
语言
为一些非常短
的
操作编写一些微基准测试代码。例如,我正在测量
的
一件事是,根据传递
的
参数数量,调用一个空函数需要多少个
周期
。目前,我在每次操作之前和之后使用RDTSC
指令
进行计时,以获得CPU
的
周期
计数。但是,我担心在第一个RDTSC之前发出
的
指令
可能会减慢我正在测量
的
实际
指令
。我还担心,在第二个RDTSC发布之前,完整
的
操作可能不会完
浏览 4
提问于2009-02-22
得票数 8
回答已采纳
1
回答
在没有上下文切换
的
情况下执行代码块
、
、
有没有办法在不切换上下文
的
情况下用
C
语言
执行一段代码? 我已经修改了perf stat以定期对计数器进行采样。虽然这是有效
的
,但它最终给了我一些坏
的
数据点,比如0
周期
x
指令
。我认为发生这种情况
的
原因是因为上下文切换。因为我
的
代码总是在
指令
计数器之前拉取
周期
计数器值,如果在拉取
周期
计数器值之后发生上下文切换,并且如果我正在分析
的
进程针对调度量程
的
某
浏览 1
提问于2012-12-15
得票数 0
2
回答
周期
精确仿真
、
、
我目前正在为我
的
下一个仿真项目学习
C
语言
,一个
周期
精确
的
68000内核(我
的
上一个项目是一个用Java编写
的
非
周期
精确
的
Sega Master系统仿真器,现在已经是它
的
第三个版本)。我
的
查询认为
周期
级别的准确性对我来说是一件新
的
事情。要将事情分解到1个CPU
周期
的
粒度,我可能需要知道内存访问需要多长时间等等,但我
的</e
浏览 0
提问于2012-06-22
得票数 4
回答已采纳
1
回答
从ARM购买in
的
半导体制造商应该满足参考手册中所描述
的
指令
的
时钟
周期
吗?
、
、
对于由德州仪器公司生产
的
CC3220S,我用
C
编程
语言
开发了一个函数,它使用内联程序集等待1秒(不包括循环前和循环外
的
指令
)。根据,针对PC机
的
MOV
指令
需要1+P
指令
周期
,其中P在1到3之间,这取决于流水线填充。最坏
的
情况是,这意味着循环在6个时钟
周期
内执行。 CC3220S
的
时钟速度是80 MHz。然而,执行循环1000万次会产生所需
的
1秒延迟(用逻辑分析器验
浏览 3
提问于2019-12-07
得票数 1
回答已采纳
1
回答
使用+和[]进行间接寻址
、
我对asm
的
东西是个新手。在TI
的
C
28x处理器上查看从
C
生成
的
汇编
语言
,并具有以下
指令
我知道这是一个很长
的
操作数移动
指令
,它接受累加器中
的
值,并将其放在...指向
的
位置。什么?它们会占用额外
的
周期
吗?
浏览 2
提问于2013-04-05
得票数 3
回答已采纳
1
回答
NASM中
的
RDTSCP总是返回相同
的
值(给单个
指令
计时)。
、
、
、
、
我正在使用RDTSC和RDTSCP在NASM测量各种汇编
语言
指令
的
机器
周期
,以帮助优化。web资源(其中大部分都是
C
中
的
例子)。使用下面的代码(从
C
翻译过来),我测试了各种
指令
,但是RDTSCP总是在RDX中返回0,在RAX中返回7。我最初认为7是循环
的
数目,但显然不是所有的
指令
都有7个循环。当我将
指令
更改为两个
周期
指令
时:cpuid add rcx
浏览 0
提问于2019-02-10
得票数 5
回答已采纳
1
回答
Web程序集(Wasm),垃圾收集
、
、
、
据我所知,组件将是静态类型化
语言
的
编译目标,可以在浏览器中运行。有人声称它可以在浏览器中以(接近)本地速度运行。这是因为Wasm是相对接近机器
指令
的
适当机器。然而,有两种类型
的
语言
可以编译为Wasm: 我目前
的
理解是,垃圾回收是一个
浏览 0
提问于2018-09-27
得票数 7
回答已采纳
2
回答
给线程
的
最小时间
、
、
、
、
我
的
问题是一般
的
线程(例如:Java中
的
线程)。问题:当线程处于(Runnable - state) -即:它正在执行,并且正在发出
指令
(例如通过调用方法addOneToX(int x))时,线程是否可以在完成
指令
之前而在它开始执行它之后退出或停止它
的
工作换句话说,高级
语言
中
的
大部分
指令
被解码为机器专用
语言
,并分解为CPU中
的
多个机器
周期
(时钟
周期
)。因此,我想这
浏览 4
提问于2017-03-21
得票数 1
回答已采纳
2
回答
什么是机器循环?
、
、
、
我有点搞不懂“机器
周期
”的确切定义。 我们已经看到,所有的
指令
都分三个阶段执行:提取、解码、执行。我们现在需要介绍一些定义。每个阶段都需要几个时钟
周期
。Z80在一个或多个逻辑
周期
中执行每个阶段,称为“机器循环”。现在让我困惑
的
是--据我所理解--第一个基本意思是:机器
周期
是一个提
浏览 0
提问于2016-08-06
得票数 5
回答已采纳
1
回答
Java中
的
可挂起脚本?
、
、
所以基本上,我理想情况下会喜欢一种解释型
语言
,它可以简单地单步执行
指令
,并且可以通过该
语言
中
的
方法调用来暂停执行。例如,
浏览 0
提问于2016-03-07
得票数 0
1
回答
为什么
C
中
的
rand()函数不是密码伪随机生成器?
例如,可能
的
rand()实现之一:{ int result;
浏览 0
提问于2018-03-19
得票数 2
1
回答
黑客计算机
的
抓取-执行
周期
需要多少步骤?
、
、
、
、
我已经完成了从南德到俄罗斯方块课程
的
第一部分(谢谢MadOverlord和大家!)但仍然无法计算出Hack CPU
的
提取-执行
周期
所需
的
步骤。 我读过但它怎么知道?一本关于8位“共享
指令
和数据存储器”计算机设计
的
书,它
的
特点是一台简化
的
有限状态机,称为步进器,它在每个提取-执行
周期
中有六个步骤(三个用于获取+增量PC/IAR计数器,其余三个用于执行,要么是逻辑/算术在Nand2Tetris中,我们有一个哈佛体系结构
浏览 8
提问于2022-09-03
得票数 1
回答已采纳
2
回答
有多少个装配
指令
处于位移位操作中?
、
、
我正在努力提高我
的
微控制器库
的
效率,而在这个库中调用最多
的
函数(每秒可以调用100万次)是我集中精力
的
地方。value = ((uint16_t) type) << 10作为替代方案,我正在考虑做这样
的
事情。程序库采
浏览 5
提问于2022-02-22
得票数 -1
3
回答
C
++中6510 /
C
64模拟器,如何实现
周期
/时钟
、
、
、
我正在尝试实现一个简单
的
C
++
C
64模拟器(6510 + SID,也许还有VIC2)。到目前为止,我们只介绍了CPU
的
基础知识,所以我能够实现一个可以从内存中读取和执行
指令
的
CPU,完全忽略了在真正
的
C
64中,一些
指令
需要超过1个
周期
的
事实。据我所知:-在
指令
精确模拟中,每条
指令
都在一个CPU
周期
内执行-在
周期
中-精确模拟,一
浏览 0
提问于2015-09-18
得票数 0
3
回答
循环与Numpy矢量化计算时间
、
、
、
我正在随机比较(一个显式
的
for-循环)和numpy中
的
矢量化实现
的
计算时间。我精确地运行了100万次迭代,发现了一些惊人
的
差异。For-循环采用了大约646 in
的
,而np.exp()函数在小于20 in
的
中计算了相同
的
结果。= np.exp(v)print(x)我得到<em
浏览 0
提问于2018-07-27
得票数 1
1
回答
计算为ARM生成
的
程序集中每条
指令
的
指令
周期
数
、
如何计算为ARM
的
C
/
C
++程序生成
的
汇编中每条
指令
的
指令
周期
数?有没有什么工具可以解决这个问题呢?我不想每次都查看ARM
指令
集。
浏览 4
提问于2013-12-10
得票数 0
1
回答
处理器性能复杂而简单
的
指令
、
、
、
我希望有人能帮助我朝着正确
的
方向前进。 处理器R是一个具有2 2GHz时钟速率
的
64位RISC处理器.假设零等待状态内存访问,平均
指令
需要一个
周期
才能完成。处理器
C
是一个具有1.8GHz时钟速率
的
CISC处理器。一般
的
简单
指令
需要一个
周期
才能完成,假设零等待状态内存访问。平均复杂
指令
需要两个
周期
才能完成,假设零等待状态内存访问。处理器R不能直接实现复杂
的
处理
指令
浏览 4
提问于2015-05-05
得票数 2
3
回答
如何测量读取/
周期
或
指令
/
周期
?
、
、
、
、
我想彻底测量和调优我
的
C
/
C
++代码,以便在x86_64系统上使用缓存时执行得更好。我知道如何使用计数器(在我
的
Windows机上是QueryPerformanceCounter)来测量时间,但我想知道如何测量相对于工作集
的
每个
周期
的
指令
或每个
周期
的
读/写
指令
。
浏览 0
提问于2013-03-10
得票数 1
回答已采纳
1
回答
每条
指令
的
时钟
周期
数CUDA
我是CUDA
的
初学者。现在我正在计算每条
指令
的
时钟
周期
数(例如加法)。在https://docs.nvidia.com/cuda/cuda-
c
-programming-guide/index.html#arithmetic-instructions中,它只给出不同算术运算
的
指令
吞吐量例如,7.x中32位浮点加法
的
吞吐量为64。那么,我可以将64/32=2作为每条
指令
的
浏览 22
提问于2020-10-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
RoHS指令和WEEE指令:涵盖电子产品标准的生命周期
C语言中的#define预处理指令老手都是这样用,你全都掌握了吗?
C语言,C+语言
C+的老豆C语言,C#的林北的C+,C语言的面向过程
C语言编程篇·最简单的C语言程序
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
腾讯会议
活动推荐
运营活动
广告
关闭
领券