YOLO模型训练GPU训练环境配置方法

YOLO模型训练GPU训练环境配置方法 ⒈查看电脑显卡配置可通过类似联想电脑管家-硬件配置-显卡查看本电脑的显卡配置使用GPU训练模型时必须使用英伟达显卡NVIDIA如下图显卡型号为NVIDIA GeForce RTX 5070 Laptop GPU⒉查看显卡版本首先确认电脑有独立显卡并且是NVIDIA显卡可用“WinR-CMD”下执行指令nvidia-smi此时可以查看到CUDA的最高支持版本12.8表明本电脑具有独立显卡可进行GPU训练条件需要注意⑴驱动版本决定CUDA版本驱动版本越高可安装的CUDA版本越高⑵ CUDA向下兼容。⒊安装显卡驱动在网址https://www.nvidia.cn/geforce/drivers/下根据上述步骤1中显卡型号检索对应显卡驱动如下图根据用途选择NVIDIA Studio 驱动程序也即驱动“610.47-desktop-win10-win11-64bit-international-nsd-dch-whql”。⒋CUDA安装在网址CUDA Toolkit Archive | NVIDIA Developer下载对应版本CUDA根据网址NVIDIA - CUDA | onnxruntime介绍确保ONNX Rtime、CUDA、cuDNN之间的兼容性符合下表鼠标右键以“管理员权限运行A”“cuda_12.8.0_571.96_windows.exe”按默认C盘安装点击“OK”根据提示继续直到下图选择“自定义C高级”点击“下一步”勾选下图全部选项点击“下一步”保持默认点击“下一步”点击“下一步”勾选“为NVIDIA应用程序创建桌面快捷方式”点击“关闭”安装完成后可以再次在cmd里输入命令“nvcc -V”查看如下显示即安装成功由于CUDA向下兼容当电脑安装有高版本时可忽略对应低版本安装⒌Anaconda Prompt环境安装在Anaconda Prompt环境下进行yolo模型训练不考虑安装Pycharm。安装“Miniconda3-latest-Windows-x86_64.exe”是Anaconda的简易版满足yolo的常规训练使用是一个轻量级的Python包管理工具和环境管理工具网址https://www.anaconda.com/安装过程如下以管理员权限A运行Miniconda3点击“Next”点击“I Agree”选择“Just Me(recommended)”点击“Next”更改路径为D盘并缩短安装路径否则后文配置路径轨迹可能失败点击“Next”全部勾选点击“Install”安装完成点击“Next”不勾选点击“Finish”根据安装路径配置如下文件的路径的环境变量右键“我的电脑-属性”在弹出界面检索“本机系统环境变量”在弹出界面依次点击“环境变量N-系统环境变量-Path-编辑-新建”新建如下路径并点击“确定”保存① D:\ProgramData\Anaconda3② D:\ProgramData\Anaconda3\Scripts③ D:\ProgramData\Anaconda3\Library\bin⒍CUDNN安装在网址cuDNN 档案 |NVIDIA 开发者下载需要创建账号下载。根据上述下载的CUDA版本12.8.0选择“下载cuDNN v8.9.72023年12月5日适用于CUDA 12.x”下“Windows 本地安装程序zip”将得到的压缩文件“cudnn-windows-x86_64-8.9.7.29_cuda12-archive.zip”进行解压解压后得到下图三个文件夹即bin、include和lib全选复制进cuda的文件夹中进行覆盖替换替换完成后即cudnn安装完成。按照本文教程安装的cuda的文件夹默认在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8目录下如下图点击“是”根据安装路径配置如下文件的路径的环境变量右键“我的电脑-属性”在弹出界面检索“本机系统环境变量”在弹出界面依次点击“环境变量N-系统环境变量-Path-编辑-新建”新建如下路径并点击“确定”保存①C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\bin②C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\include③C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\lib\x64配置环境如下图由于在环境变量可能无法保存为此在“WinR-CMD”下执行指令setx PATH %PATH%;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\bin;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\include;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\lib\x64此时执行如下表示环境变量设置成功⒎验证如下图打开“命令提示符”找到如下路径C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\extras\demo_suite 下的 bandwidthTest.exe 和 deviceQuery.exe。将“bandwidthTest.exe” 和 “deviceQuery.exe”分别托人命令提示符并“Enter”分别显示如下表示安装成功⒏安装GPU版本的PyTorch选择与 cuda 对应的 pytorch 版本。如果安装的 cuda 版本大于 pytorch 支持的版本请选择向下版本的网址https://pytorch.org/get-started/locally/?_gl1*16dk9fu*_up*MQ..*_ga*NjE0Njc1OTQuMTc4MDQ5MjY5Mg..*_ga_469Y0W5V62*czE3ODA0OTI2OTEkbzEkZzEkdDE3ODA0OTI3MTgkajMzJGwwJGgw。复制pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126粘贴在命令提示符如下图进行安装完成安装后显示如下图并将“C:\Users\WangF\AppData\Roaming\Python\Python39\Scripts”添加在环境变量的Path中在电脑下方“搜索”输入Anaconda Prompt (Anaconda3)弹出如下界面安装辅助安装包“pip install pandas matplotlib notebook”安装如下测试PyTorch是否安装成功管理员权限打开Anaconda Prompt (Anaconda3)中输入“jupyter notebook”并“Enter”显示如下界面并显示如下界面点击“Files-New-Python3(ipykemel)”输出如下图点击“Untitled”输入重命名如“jianwen0513”点击“重命名”如下图在输入框输入“import torch”按“shiftenter”执行并提供第行代码框表示PyTorch启动运行输入“torch.randn(3,4)” 按“shiftenter”执行如下图表示生成3行4列随机数成功:输入“torch.cuda.is_available()”验证GPU是否可用输出True表示可用测试代码如下import torch# -------------------------- 1. 检查 CUDA 是否可用 --------------------------cuda_available torch.cuda.is_available()print(fCUDA 可用状态: {✅ 可用 if cuda_available else ❌ 不可用})if cuda_available:# -------------------------- 2. 检查 CuDNN 是否可用 --------------------------cudnn_enabled torch.backends.cudnn.enabledprint(fCuDNN 启用状态: {✅ 已启用 if cudnn_enabled else ❌ 未启用})# -------------------------- 3. 额外信息可选 --------------------------print(f\n 额外环境信息)print(f- CUDA 版本: {torch.version.cuda}) # PyTorch 编译时使用的 CUDA 版本print(f- CuDNN 版本: {torch.backends.cudnn.version()}) # CuDNN 版本print(f- GPU 设备数量: {torch.cuda.device_count()}) # 可用 GPU 数量print(f- 当前 GPU 名称: {torch.cuda.get_device_name(0)}) # 第 1 个 GPU 名称输出如下信息