首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >解决问题使用nvcc fatal : Unsupported gpu architecture 'compute_75'

解决问题使用nvcc fatal : Unsupported gpu architecture 'compute_75'

原创
作者头像
大盘鸡拌面
发布于 2023-11-29 01:49:00
发布于 2023-11-29 01:49:00
1.7K00
代码可运行
举报
文章被收录于专栏:软件研发软件研发
运行总次数:0
代码可运行

解决问题使用nvcc fatal : Unsupported gpu architecture 'compute_75'

在使用 NVCC 编译 CUDA 代码时,有时候会遇到错误信息 nvcc fatal: Unsupported gpu architecture 'compute_75'。这个错误通常表示当前的 GPU 架构不受支持,需要采取一些步骤来解决这个问题。

1. 检查 CUDA 版本

首先,我们需要确认我们正在使用的 CUDA 版本是否支持我们的 GPU 架构。不同版本的 CUDA 支持不同的 GPU 架构,如果 GPU 架构超出了 CUDA 版本的支持范围,就会出现这个错误。 要检查 CUDA 版本,可以运行以下命令:

代码语言:javascript
代码运行次数:0
运行
复制
bashCopy code
nvcc --version

这将显示当前 CUDA 安装的版本。然后,你可以查阅 NVIDIA 官方文档,找到该版本所支持的 GPU 架构,并确认你的 GPU 是否在支持列表中。

2. 更新 CUDA 版本

如果发现当前的 CUDA 版本不支持你的 GPU 架构,那么你需要更新 CUDA 到一个支持你的 GPU 架构的版本。 首先,你需要卸载当前的 CUDA 版本。具体的步骤将根据你的操作系统和 CUDA 安装方式而有所不同。你可以参考官方文档或者 NVIDIA 的网站来获取卸载指南。 然后,你可以从 NVIDIA 的开发者网站下载最新版本的 CUDA Toolkit。在下载时,确保选择支持你的 GPU 架构的版本。 安装 CUDA Toolkit 时,按照提示逐步进行。确保按照官方文档的建议进行正确的配置和设置。

3. 修改 GPU 架构

如果你不能更新 CUDA 版本或者你的 GPU 架构不在支持列表中,你可以尝试手动设置目标的 GPU 架构。 在编译命令中,可以通过 -arch 参数手动指定目标的 GPU 架构。例如,如果你的 GPU 架构是 compute_75,你可以使用以下命令:

代码语言:javascript
代码运行次数:0
运行
复制
bashCopy code
nvcc -arch=sm_75 ...

请注意,这种做法可能会导致生成的代码不能充分利用 GPU 的性能和特性,因为它们是为支持的 GPU 架构进行了优化的。

4. 其他注意事项

  • 确保你的系统上已经正确安装了 CUDA 驱动程序。你可以参考 NVIDIA 的官方文档了解如何正确安装和配置驱动程序。
  • 如果你是在使用 CUDA 的容器环境(如 Docker),确保容器内的 CUDA 版本与宿主机一致,以避免出现版本不匹配的问题。
  • 如果你使用的是第三方库或框架(如 TensorFlow、PyTorch 等),确保它们与你的 CUDA 版本兼容并正确配置。

结论

nvcc fatal: Unsupported gpu architecture 'compute_75' 错误通常表示你的 GPU 架构不受当前 CUDA 版本的支持。你可以通过更新 CUDA 版本、手动设置 GPU 架构或进行其他必要的配置来解决这个问题。请根据具体的情况选择合适的解决方案,并确保你的 CUDA 版本和 GPU 架构之间的兼容性。

当遇到 nvcc fatal: Unsupported gpu architecture 'compute_75' 错误时,我们可以通过修改编译选项来解决这个问题。以下是一个示例代码,在编译时手动指定目标 GPU 架构为 sm_75

代码语言:javascript
代码运行次数:0
运行
复制
cppCopy code
#include <iostream>
__global__ void simpleKernel() {
    printf("Hello from GPU!\n");
}
int main() {
    // 执行简单的CUDA内核
    simpleKernel<<<1, 1>>>();
    
    // 检查CUDA错误
    cudaError_t cudaErr = cudaGetLastError();
    if (cudaErr != cudaSuccess) {
        std::cerr << "CUDA error: " << cudaGetErrorString(cudaErr) << std::endl;
        return 1;
    }
    
    // 同步GPU
    cudaDeviceSynchronize();
    
    // 输出结果
    std::cout << "CUDA kernel executed successfully!" << std::endl;
    
    return 0;
}

在编译时,我们需要使用 -arch 参数来指定目标 GPU 架构:

代码语言:javascript
代码运行次数:0
运行
复制
bashCopy code
nvcc -arch=sm_75 example.cu -o example

这个示例代码是一个简单的 CUDA 程序,它在 GPU 上执行一个内核函数,并打印一条消息。通过手动指定目标 GPU 架构为 sm_75,我们可以解决 nvcc fatal: Unsupported gpu architecture 'compute_75' 错误。 请注意,这只是一个示例代码,实际的应用场景可能更为复杂。在实际应用中,你可能需要进行更多的 CUDA 程序和功能开发,以及更复杂的编译配置。你需要根据你的具体需求和环境进行相应的调整和配置。

compute_75 是 NVIDIA GPU 架构的一个代号,也被称为 Turing 架构。它是 NVIDIA 公司推出的一代图形处理器架构,用于高性能计算和图形渲染任务。 Turing 架构于2018年发布,是继 Pascal 架构之后的一项重大升级。它引入了许多新的硬件功能和技术,以提供更高的性能和更丰富的特性。Turing 架构采用了新的图灵编程模型,引入了 Tensor Cores、RT Cores、SM (Streaming Multiprocessor) 等新的硬件组件和指令集,大大提高了计算性能和图形渲染能力。 下面是一些 Turing 架构的特性和主要改进点:

  1. Tensor Cores:Tensor Cores 是一种专门用于深度学习任务的硬件单元。它能够执行高度并行的混合精度矩阵运算,提供极高的吞吐量和能效,加速深度学习模型的训练和推理。
  2. RT Cores:RT Cores 是一种专门用于光线追踪任务的硬件单元。它能够加速光线追踪算法的计算,提供更高的图形渲染质量和真实感。RT Cores 的引入使得实时光线追踪成为可能,为游戏和虚拟现实等领域带来更逼真的图像效果。
  3. **SM (Streaming Multiprocessor)**:Turing 架构中的 SM 具有更多的 CUDA 核心和更大的共享内存,提供更高的并行计算性能和更大的存储容量。每个 SM 还包括更多的寄存器文件和 L1 缓存,以及自动支持新的功能和指令集。
  4. 更高的性能和能效:Turing 架构通过提供更多的 CUDA 核心、更高的时钟频率和更先进的硬件优化,提供了比之前架构更高的计算性能和能效。 Turing 架构在各种计算任务和图形渲染应用中都展现出非常强大的性能和功能。它被广泛应用于机器学习、科学计算、数据分析、图形设计和游戏等领域。同时,Turing 架构也为未来的 GPU 发展奠定了基础,为更先进的图形和计算任务提供更好的支持。 然而,需要注意的是,不同版本的 CUDA 对 Turing 架构的支持可能有所不同。较早的 CUDA 版本可能不支持 compute_75 架构,需要升级到支持该架构的 CUDA 版本,或手动指定目标 GPU 架构来解决兼容性问题。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
一文读懂 NVIDIA GPU Core
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI)生态领域相关的底座技术 - NVIDIA GPU Core。
Luga Lee
2025/01/10
4130
一文读懂 NVIDIA GPU Core
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
近期,AIGC领域呈现出一片繁荣景象,其背后离不开强大算力的支持。以ChatGPT为例,其高效的运行依赖于一台由微软投资建造的超级计算机。这台超级计算机配备了数万个NVIDIA A100 GPU,并利用60多个数据中心的数十万个GPU辅助,为ChatGPT提供了强大的算力支持。这种规模的算力部署不仅体现了AIGC技术的先进性,也预示着人工智能技术未来的发展趋势。这种集成了高性能计算、大数据处理和人工智能算法的超级计算机,将成为推动科技进步的重要引擎。
汀丶人工智能
2024/01/29
8.2K0
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
为什么配置NVIDIA Isaac 机器人开发平台,对GPU显卡的要求这么高?
很多想要开始学习NVIDIA Isaac智能机器人整合工具的新手,一开始比较困惑的,就是就是这套软件有什么最基本以及较合适的系统配置?毕竟这些系统都不是便宜的东西,错误的投资会造成不小的损失。
GPUS Lady
2025/05/27
2570
为什么配置NVIDIA Isaac 机器人开发平台,对GPU显卡的要求这么高?
深入GPU硬件架构及运行机制
对于大多数图形渲染开发者,GPU是既熟悉又陌生的部件,熟悉的是每天都需要跟它打交道,陌生的是GPU就如一个黑盒,不知道其内部硬件架构,更无从谈及其运行机制。
数字芯片社区
2021/04/19
5K1
深入GPU硬件架构及运行机制
讲解nvcc fatal : A single input file is required for a non-link phase when an outp
在使用NVIDIA CUDA进行GPU加速的开发过程中,你可能会遇到"nvcc fatal: A single input file is required for a non-link phase when an output file is specified"这样的错误信息。本篇文章将解释该错误的原因,并提供解决方案。
大盘鸡拌面
2023/12/18
1K0
讲解Unsupported gpu architecture 'compute_*'2017解决方法
摘要: 在使用2017年以前的NVIDIA GPU进行深度学习训练时,经常会遇到"Unsupported GPU Architecture 'compute_*'"的错误。本篇文章将介绍该错误的原因并提供解决方法。
大盘鸡拌面
2023/12/15
8030
【玩转 GPU】英伟达GPU架构演变
1999年,英伟达发布第一代GPU架构GeForce 256,标志着GPU时代的开始。随后,英伟达推出了Tesla、Fermi、Kepler、Maxwell、Pascal、Volta、Turing和Ampere等GPU架构,不断增强GPU的计算能力和程序性,推动GPU在图形渲染、人工智能和高性能计算等领域的应用。
疯狂的KK
2023/06/08
11.8K0
【玩转 GPU】英伟达GPU架构演变
【AI系统】GPU 架构回顾(从2018年-2024年)
2018 年 Turing 图灵架构发布,采用 TSMC 12 nm 工艺,总共 18.6 亿个晶体管。在 PC 游戏、专业图形应用程序和深度学习推理方面,效率和性能都取得了重大进步。相比上一代 Volta 架构主要更新了 Tensor Core(专门为执行张量/矩阵操作而设计的专门执行单元,深度学习计算核心)、CUDA 和 CuDNN 库的不断改进,更好地应用于深度学习推理。RT Core(Ray Tracing Core)提供实时的光线跟踪渲染,包括具有物理上精确的投影、反射和折射,更逼真的渲染物体和环境。支持 GDDR6 内存,与 GDDR5 内存相比,拥有 14 Gbps 传输速率,实现了 20%的的效率提升。NVLink2.0 支持 100 GB/s 双向带宽,使特定的工作负载能够有效地跨两个 GPU 进行分割并共享内存。
用户11307734
2024/11/27
4190
为什么配置NVIDIA Isaac,对GPU显卡的要求这么高?
很多想要开始学习NVIDIA Isaac智能机器人整合工具的新手,一开始比较困惑的,就是就是这套软件有什么最基本以及较合适的系统配置?毕竟这些系统都不是便宜的东西,错误的投资会造成不小的损失。
GPUS Lady
2025/05/26
1870
英伟达Tensor Core架构技术原理
英伟达的Tensor Core架构是一种专为加速人工智能、深度学习、高性能计算(HPC)等领域中的矩阵运算和张量运算而设计的硬件单元。自首次在Volta架构中引入以来,Tensor Cores已成为NVIDIA高端GPU的核心特性,并在后续的Turing、Ampere及之后的架构中持续进化。
用户7353950
2024/06/06
7810
英伟达Tensor Core架构技术原理
技术总结|十分钟了解GPU
最近在看《黄仁勋:英伟达之芯》,这本书讲述了英伟达是如何一步一步优化GPU,感觉创业不易,不过本文为了让大家更好了解GPU,所以简单汇总了一些知识点。
用户1904552
2025/02/27
1350
技术总结|十分钟了解GPU
12年来最大飞跃!黄仁勋发布史上最强GPU,世界首个实时光线追踪新一代图灵架构
【新智元导读】刚刚,英伟达CEO黄仁勋在SIGGRAPH 2018上大秀肌肉,推出世界首个实时光线追踪GPU,基于图灵架构,这是自2006年以来GPU实现的最最重大的飞跃,每秒处理高达10GB Rays,这将彻底改变整个计算机图形处理界的工作流程。
新智元
2018/08/16
4350
12年来最大飞跃!黄仁勋发布史上最强GPU,世界首个实时光线追踪新一代图灵架构
黄仁勋重磅发布 RTX 2080 Ti,游戏显卡终结者!499美元起
今天,在 Gamescom 的 NVIDIA keynote 演讲中,老黄不负众望,重磅发布新系列的高端显卡: GeForce RTX 2080,RTX 2080 Ti,以及 RTX 2070,都是“Founders”版本。
新智元
2018/09/25
7640
黄仁勋重磅发布 RTX 2080 Ti,游戏显卡终结者!499美元起
Rust 与 GPU 编程的现状与前景探究
话说,程序员三大浪漫,操作系统、编译器和图形处理。Rust 语言已经攻陷了其中两大浪漫,操作系统和编译器,那么图形处理呢?Rust 语言还能“浪”起来吗?
张汉东
2023/11/20
4.1K0
Rust 与 GPU 编程的现状与前景探究
英伟达十年力作:新一代光线追踪显卡 Quadro RTX及核心架构Turing,可支持AI运算
北京时间 8 月 14 日清晨,英伟达(NVIDIA)CEO 黄仁勋准时出席在温哥华举办的 SIGGRAPH 2018 计算机图形技术大会。
AI科技大本营
2018/08/17
6110
英伟达十年力作:新一代光线追踪显卡 Quadro RTX及核心架构Turing,可支持AI运算
英伟达A100 GPU的核心数,Tesla系列
GeForce RTX是英伟达(NVIDIA)公司旗下的一个高端显卡系列。其中,“GeForce”是英伟达推出的显卡品牌,广泛应用于游戏、图形设计、视频编辑等多个领域,以其出色的图形处理能力和性能而著称。“RTX”则代表了该系列显卡所具备的特殊技术和功能,具体来说,“RTX”是Ray Tracing Texel eXtreme的缩写,意味着光线追踪技术的极致表现。
zhangjiqun
2024/07/31
7160
英伟达 GPU 十年架构演进史
作者:tomoyazhang,腾讯 PCG 后台开发工程师 随着软件从 1.0 进化到 2.0,也即从图灵机演进到类深度学习算法。计算用的硬件也在加速从 CPU 到 GPU 等迁移。本文试图整理从英伟达 2010 年开始,到 2020 年这十年间的架构演进历史。 CPU and GPU 我们先对 GPU 有一个直观的认识,如下图: 众所周知,由于存储器的发展慢于处理器,在 CPU 上发展出了多级高速缓存的结构,如上面左图所示。而在 GPU 中,也存在类似的多级高速缓存结构。只是相比 CPU,GPU
腾讯大讲堂
2021/10/20
4.1K0
为什么说NVIDIA推出了史上最强的GPU?
8月14日早上北京时间7点,在SIGGRAPH 2018计算机图形与交互技术大会上,英伟达创始人兼CEO黄仁勋推出世界上第一款光线追踪GPU!据媒体报道老黄把这块GPU称作”自2006年以来最重要的一块GPU“,耗时10年打造。
GPUS Lady
2018/08/17
1.3K0
为什么说NVIDIA推出了史上最强的GPU?
解读 | NVIDIA Turing 架构解析:追光逐影,成败未定
AI 科技评论消息,自NVIDIA的Turing架构问世已经过去了一个多月时间,GeForce RTX 20系列的发布以及实时光线跟踪技术的推出,让NVIDIA将使用多年的“GeForce GTX”更名为“GeForce RTX“,并彻底改变了游戏显卡。实时光线跟踪、RT Core、Tensor核心、AI功能(即DLSS)、光线跟踪API,所有这些都汇集在一起,为游戏开发和GeForce显卡的未来发展指明了新方向。
AI科技评论
2018/10/25
1.3K0
解读 | NVIDIA Turing 架构解析:追光逐影,成败未定
NVIDIA Blackwell RTX GPU与CUDA 12.8框架更新指南
随着NVIDIA Blackwell RTX GPU的发布,为了确保应用程序与这些新一代GPU的兼容性和最佳性能,应用开发者必须更新到最新的AI框架。NVIDIA专门发布了一个指南,详细介绍与NVIDIA Blackwell RTX GPU兼容所需的核心软件库更新,特别是CUDA 12.8的相关信息。
GPUS Lady
2025/02/04
2.3K0
NVIDIA Blackwell RTX GPU与CUDA 12.8框架更新指南
推荐阅读
相关推荐
一文读懂 NVIDIA GPU Core
更多 >
目录
  • 解决问题使用nvcc fatal : Unsupported gpu architecture 'compute_75'
    • 1. 检查 CUDA 版本
    • 2. 更新 CUDA 版本
    • 3. 修改 GPU 架构
    • 4. 其他注意事项
    • 结论
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验