首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何度量cudaMalloc执行时间

如何度量cudaMalloc执行时间
EN

Stack Overflow用户
提问于 2019-11-12 11:00:59
回答 1查看 144关注 0票数 0

如何使用cuda事件来度量cudaMalloc的执行时间?我可以使用事件来测量内核时间和cudaMemcpy时间,但它不适用于cudaMalloc。使用下面的代码,我得到执行时间3.104e-06秒(这是错误的)。使用Nvidia Nsight Compute,我有0.109秒的时间。

代码语言:javascript
运行
复制
cudaEventRecord(startCuda);
cudaMalloc(&devMatrix, allocSize);
cudaEventRecord(stopCuda);
cudaEventSynchronize(stopCuda);
cudaEventElapsedTime(&timeCudaMalloc, startCuda, stopCuda);
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-12 15:07:11

尝试使用std::chrono::high_resolution_clock使用cpu时钟来测量相同的东西:http://www.cplusplus.com/reference/chrono/high_resolution_clock/now/

此外,我不熟悉Nvidia Nsight Compute,但它会增加调试代码的开销吗?

最后,cudaMalloc的执行时间是高度可变的,所以不要期望得到一致的结果。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58811377

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档