腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
SSE2
内部
函数
存储
或
提取
标量
整数
结果
的
更好
方法
、
、
、
我想知道在
使用
SSE2
时,加载和
存储
的
效率是如何变化
的
。在本例中,我希望将pclmulqdq指令(进位较少
的
乘法,对于多项式算术很有用)与普通
的
C
函数
进行比较,因此我需要与标准
函数
相同
的
“调用约定”。A和b是16个有效位,
结果
将具有32个有效位 #include <wmmintrin.h> __m128i xa =
浏览 150
提问于2021-01-14
得票数 1
回答已采纳
1
回答
将__m256d转换为__m256i
、
、
既然是这样
的
演员:在Visual下编译时,我认为可以
使用
一些
内部
函数
在将__m256d值传递给_mm256_store_si256之前将其转换为__m256i,从而避免导致错误
的
强制转换但是,在查看之后,我找不到一个
函数
浏览 0
提问于2018-06-24
得票数 1
回答已采纳
1
回答
在AVX
内部
函数
中
使用
xmm参数
、
可以将xmm寄存器参数与AVX
内部
函数
(_mm256_**_**)一起
使用
吗? 我
的
代码需要
使用
向量
整数
运算(用于加载和
存储
数据)以及向量浮点运算。
整数
代码是用
SSE2
内部
函数
编写
的
,以便与旧
的
CPU兼容,而浮点数是用AVX编写
的
,以提高速度(也有SSE代码分支,所以不建议这样做)。目前,除了
使用
编译器标志自动将所有SSE指令转
浏览 1
提问于2013-12-08
得票数 2
1
回答
找到最小/最大。优化
、
xmm5 orps xmm3, xmm5 add ecx, 4这是一个在ints中查找最大值/分钟
的
基本循环我
的
处理器是AMD K8。我不能计数cylces,但我可以比较,我
的
代码比我
的
朋友谁没有
使用
SIMD慢。我不明白为什么。这个循环不是最优
的
吗?你看到什么原因了吗?
浏览 0
提问于2016-06-05
得票数 0
回答已采纳
1
回答
64位
整数
的
SSE优化仿真
、
、
、
、
对于我正在从事
的
一个业余项目,我需要在x86 CPU上模拟某些64位
整数
操作,而且它需要快速。因此,我想知道这里
的
SSE /优化大师是否能够
使用
SSE找到一个
更好
的
实现。uint64_t X, Y; X = 1;X != Y;X & 0x1 // get lsb X | 0x1 // set
浏览 1
提问于2012-04-19
得票数 10
回答已采纳
1
回答
CMOVcc被认为是分支指令吗?
、
、
、
、
如果是这样的话,我如何重新排列我
的
代码,使它不分支?
浏览 4
提问于2019-08-16
得票数 1
回答已采纳
2
回答
代码性能问题
、
、
、
假设我有一个相对较大
的
对象列表( MyObjectModel ),名为MyBigList。MyObjectModel
的
一个属性是一个名为ObjectID
的
int。理论上,我认为MyBigList
的
大小可以达到15-20MB。我
的
数据库中还有一个表,它
存储
关于这个列表
的
一些
标量
,以便以后可以重新组合它。 怎样才能更有效率?,该
函数
从列表中
提取
标量
,将它们
存储
在DB中,并返回生成这些条
浏览 1
提问于2011-06-02
得票数 0
回答已采纳
1
回答
xmm指令"divsd“将剩余
的
内容
存储
在哪里?
、
、
在声明中:其余
的
储存在哪里?xmm寄存器是否有剩余部分
的
寄存器,如
整数
寄存器?我应该在x87指令中
使用
FPREM吗?据我所知,英特尔
的
手册在这个问题上是沉默
的
,许多研究并没有给出一个有用
的
答案。
浏览 0
提问于2018-01-19
得票数 1
回答已采纳
1
回答
当我在C++中将浮点变量赋值给int变量时,会发生什么?
、
、
、
首先,我要说,我对Assembly不太了解,但这是我想知道
的
事情。假设我在C++中有一个代码,如下所示:int i; 显然,当执行这段代码时,f (34.2)
的
值将转换为
整数
值(34),并分配给i。我
的
问题是这种转换是如何发生
的
,我
的
意思是在运行时是否发生这种转换,所以在运行时,有一个嵌入到可执行文件中
的
代码是这样
的
:f被分配给i,现在我知道f是一个浮点数,i是一个
整数
,所以我应该做<
浏览 0
提问于2014-12-13
得票数 1
回答已采纳
1
回答
两个_m128i SIMD向量之间匹配字节数
的
计数
、
、
、
、
我正在开发一个生物信息学工具,我试图
使用
SIMD来提高它
的
速度。 给定两个长度为16
的
字符数组,我需要快速地计数字符串匹配
的
索引数。如下面的foo
函数
所示,我将seq1和seq2中
的
每个字符打包到__m128i变量s1和s2中,并
使用
_mm_cmpeq_epi8同时比较每个位置。比__m128i中
的
每一点加起来都快得多,但是__popcnt128()是
函数
中最慢
的
瓶颈,占了计算速度
的
80%左右。因此
浏览 7
提问于2021-04-26
得票数 2
回答已采纳
2
回答
上证码浮点算术可重复性好吗?
、
、
、
、
x87 FPU以
使用
内部
80位精度模式而闻名,这通常会在编译器和机器之间带来意想不到
的
、不可复制
的
结果
。因此,SSE似乎不受x87与精度相关
的
问题
的
影响,唯一
的
变量是可以控制
的
变性行为。 撇开先验
函数
(与x87不同
的
不是由SSE提供
的
本机
函数
),
使用
SSE是否可以保证跨机器和编译器
的
可复制
结果
?例如,编译器优化
浏览 5
提问于2013-02-28
得票数 14
回答已采纳
2
回答
如何
使用
_mm_extract_epi8
函数
?
、
、
、
、
我
使用
的
是_mm_extract_epi8 (__m128i a, const int imm8)
函数
,它有const int参数。__m128i a; {} 如何在循环中
使用
此
函数
浏览 0
提问于2019-02-02
得票数 0
1
回答
如何处理可以在graphql中返回几种
标量
类型之一
的
字段
、
在graphql中(
使用
优秀
的
graphql),我试图返回一个对象,该字段可以等于布尔值、
整数
或
字符串。我最初
的
想法是返回布尔、
整数
或
字符串
的
联合,但是graphql告诉我,联合不能包含
标量
类型(我认为这是规范而不是graphql强加
的
约束)。我能想到
的
解决方案(不是很好)是将值作为json字符串返回并在客户端解析它。是否有
更好
的
方法
来处理可能是
浏览 0
提问于2018-04-03
得票数 3
回答已采纳
2
回答
标量
在perl中是什么意思?
、
在Perl语言中,您有三个主要
的
,“
标量
、
标量
数组和关联
标量
数组”。perl用“
标量
”这个名字到底想表达什么?这是什么比喻,应该形成
的
心理形象?但这并不能帮助我理解为什么
使用
“
标量
”这个词。Perl
的
标量
肯定不会。
浏览 10
提问于2021-04-28
得票数 4
1
回答
SQL
存储
过程
的
select语句中
标量
函数
的
替代选项
、
、
、
我有一个
存储
过程来从我
的
数据库中获取客户列表。在SP
内部
,我在select查询中调用了两个
标量
函数
,这会严重影响性能。
标量
函数
有多个if操作,用于检查多个案例并获取客户许可证信息,因此在内联中
使用
此查询更为复杂。
浏览 1
提问于2019-04-02
得票数 2
3
回答
将位向量转换为一位
、
、
、
、
对于一个非零
的
无符号
整数
值,是否有一种有效
的
方法
来获得0x00000001
或
0xFFFFFFFF,而对于没有分支
的
零值则是0?} 我知道一些优化编译器可以处理这个问题,但是即使是这样,他们又是如何做到
的
呢?我查看了位旋转哈克斯页面,但只发现了
使用
布尔条件设置/清除掩码
的
条件描述,因此从int到bool
的
转换应该在
方法
之外进行。
浏览 0
提问于2013-11-24
得票数 4
1
回答
_m128向量
的
四个32位元素
的
总和
、
、
、
我正在
使用
内部
函数
来优化我
的
一个程序。但现在我想将__m128向量中
的
四个元素相加,以便将
结果
与浮点值进行比较。例如,假设我有这个128位
的
向量:{a,b,c,d}。
SSE2
或
SSE3是否提供了一种简单
的
方法
,或者您是否有任何代码片段可以帮助我?谢谢!
浏览 6
提问于2012-04-16
得票数 2
回答已采纳
1
回答
为什么AVX2和
SSE2
按位
或
运算符
的
速度不快于一个简单
的
Why运算符?
、
、
、
、
我试图用32位
整数
加速长二进制向量
的
按位
或
运算。 在这个例子中,我们可以假设名词是单词
的
数量,它是4和8
的
倍数。因此,没有循环提醒。这个二进制向量可以包含数千位。此外,所有三位向量都
使用
_align_malloc()分配,分别以16位和18位对齐,分别用于
SSE2
和AVX2。令我惊讶
的
是,以下三个
标量
、
SSE2
和AVX2代码是在我
的
i7 CPU上
使用
完全相同
的
时间
浏览 3
提问于2019-11-13
得票数 0
1
回答
什么是打包
的
、解压缩
的
和扩展
的
打包数据?
、
、
、
、
我一直在研究,每个
函数
都在处理
整数
、浮点数
或
双填充、解压缩
或
扩展打包。那是什么包装?
浏览 0
提问于2020-10-29
得票数 8
回答已采纳
0
回答
选择满足在
存储
过程中计算
的
条件
的
行
、
、
、
我有一个
存储
过程,它接受一个参数并返回true
或
false。
存储
过程接受一个IdEmployee,如果雇员已经签约
或
没有签约服务,则分别返回true
或
false。最好
的
方法
是
使用
一个select语句获得最终
结果
,然后从该select语句中
浏览 2
提问于2017-06-07
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文心一言 VS 讯飞星火 VS chatgpt (204)-- 算法导论15.3 3题
NumPy基础:多维数组
【Python基础】Python「类型注解」:如何让你的Python代码够清晰?
Fortran For Fun之纯函数 递归函数 逐元函数
13个日期时间函数,掌握50%以上的都是超级高手!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券