tensorrt安装步骤在windows上安装步骤大同小异,以下是在Windows 10上安装TensorRT 10.9.0.34(配合CUDA 11.8和cuDNN 8.9.7)的完整步骤,可以参考安装这个流程,做到举一反三:
检查显卡配置,查询可支持的cuda版本 win左下角搜索cmd打开命令行窗口,输入nvidia-smi
可以看到显卡最高支持到cuda12.9,我们在后续的cuda版本中要选择12.9以下的。
下载CUDA 11.8
访问NVIDIA CUDA Toolkit Archive,选择版本11.8.0,下载Windows平台的安装包(如cuda_11.8.0_522.06_windows.exe
)。如果下载不下来可以尝试国内镜像下载地址github.com/futureflsl/cuda_cudnn_mirror,里面包含常见的cuda和cudnn版本可供选择,一般都是百度云盘下载即可。
运行安装程序
CUDA Toolkit 11.8
CUDA Demo Suite
(可选)CUDA Documentation
(可选)验证安装 打开命令提示符,运行:
nvcc --version
应输出类似:
nvcc: NVIDIA (R) Cuda compiler version 11.8
cudnn-windows-x86_64-8.9.7.29_cuda11-archive.zip
)。解压并复制文件
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8
): bin\
→ 复制到CUDA的bin\
include\
→ 复制到CUDA的include\
lib\
→ 复制到CUDA的lib\x64\
添加环境变量(可选)
确保CUDA的bin
目录已添加到系统PATH
。默认安装cuda后会自动加入环境变量因此这个步骤可以省略:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin
下载TensorRT
从NVIDIA TensorRT下载页获取TensorRT-10.9.0.34.Windows.win10.cuda-11.8.zip
。如果下载不下来可以尝试国内镜像地github.com/futureflsl/tensorrt_cn_mirror进行下载,当然需要自己对应安装好的cuda版本和cudnn版本,否则下载下来是无法正常使用的。因此要根据自己操作系统和cuda版本进行确认下载。如果您是RTX30-40系列显卡,可以使用cuda11以上版本,如果您是使用最新RTX50系列显卡则需要最新的tensorrt版本比如10.10版本。
解压TensorRT
将zip解压到目标目录(如C:\TensorRT-10.9.0.34
)。
设置环境变量
添加TensorRT的lib
目录到系统PATH
:
C:\TensorRT-10.9.0.34\lib
创建环境变量TENSORRT_PATH
指向TensorRT根目录:
TENSORRT_PATH = C:\TensorRT-10.9.0.34
安装Python Wheel(可选) 如需Python支持,安装对应的wheel文件:
pip install C:\TensorRT-10.9.0.34\python\tensorrt-10.9.0-cp3x-none-win_amd64.whl
(将cp3x
替换为你的Python版本,如cp38
对应Python 3.8)
验证安装
C++验证:检查lib
目录是否被正确链接。在cmd上输入trtexec有显示则表示正常
Python验证:
import tensorrt
print(tensorrt.__version__) # 应输出10.9.0
运行TensorRT自带的示例(如sample_mnist
):
C:\TensorRT-10.9.0.34\samples\sample_mnist
。完成以上步骤后,TensorRT环境即可正常使用。