YOLO-v5保姆级教程:从环境搭建到实战检测,小白也能轻松上手

YOLO-v5保姆级教程:从环境搭建到实战检测,小白也能轻松上手 YOLO-v5保姆级教程从环境搭建到实战检测小白也能轻松上手1. 环境准备与快速部署1.1 系统要求与准备工作在开始之前请确保您的系统满足以下基本要求操作系统Ubuntu 18.04/20.04推荐或 Windows 10/11GPUNVIDIA显卡建议GTX 1060 6GB或更高驱动已安装NVIDIA驱动版本450.80.02CUDA11.3或更高版本可选GPU加速需要Python3.8或3.9小贴士如果您没有GPU设备也可以使用CPU运行YOLO-v5但推理速度会明显降低。1.2 一键安装YOLO-v5镜像CSDN星图镜像已经为您准备好了完整的YOLO-v5环境只需简单几步即可完成部署访问CSDN星图镜像广场搜索YOLO-v5镜像点击立即部署按钮等待部署完成通常需要2-5分钟部署完成后您可以通过以下三种方式使用Jupyter Notebook通过网页界面交互式运行代码SSH连接使用终端直接操作Web Demo直接体验预置的检测功能1.3 验证安装是否成功让我们运行一个简单的测试脚本来验证环境是否正常import torch print(PyTorch版本:, torch.__version__) print(CUDA是否可用:, torch.cuda.is_available()) model torch.hub.load(ultralytics/yolov5, yolov5s, pretrainedTrue) print(YOLO-v5模型加载成功!)如果看到类似以下输出说明环境配置正确PyTorch版本: 1.10.0cu113 CUDA是否可用: True YOLO-v5模型加载成功!2. YOLO-v5基础概念快速入门2.1 YOLO是什么YOLOYou Only Look Once是一种流行的实时目标检测算法它的核心思想是将目标检测任务转化为一个回归问题通过单次前向传播就能预测图像中所有目标的边界框和类别。与传统方法的对比特性传统方法YOLO检测方式滑动窗口分类器单次前向传播速度慢快精度较高中等实时性不适合非常适合2.2 YOLO-v5模型家族YOLO-v5提供了多个不同大小的模型适合不同场景YOLOv5n超轻量级适合移动端YOLOv5s小型速度与精度平衡YOLOv5m中型通用场景YOLOv5l大型高精度需求YOLOv5x超大型最高精度对于初学者建议从YOLOv5s开始它在速度和精度之间取得了很好的平衡。3. 快速上手第一个目标检测程序3.1 加载预训练模型让我们从最简单的例子开始 - 使用预训练模型检测图像中的物体import torch from PIL import Image # 加载预训练模型自动下载约27MB model torch.hub.load(ultralytics/yolov5, yolov5s, pretrainedTrue) # 加载测试图片 img Image.open(zidane.jpg) # 或使用网络图片: https://ultralytics.com/images/zidane.jpg # 进行推理 results model(img) # 显示结果 results.show() # 或 results.save() 保存结果运行这段代码您将看到类似这样的输出image 1/1: 720x1280 2 persons, 1 tie Speed: 10.0ms pre-process, 15.0ms inference, 2.0ms NMS per image at shape (1, 3, 640, 640)3.2 理解检测结果YOLO-v5的检测结果包含丰富的信息# 打印检测到的对象信息 print(results.pandas().xyxy[0])输出示例xmin ymin xmax ymax confidence class name 0 749.50 43.5 1148.0 704.5 0.895023 0 person 1 433.50 433.5 517.5 714.5 0.640259 0 person 2 114.75 195.5 1095.0 708.0 0.689759 27 tiexmin, ymin, xmax, ymax边界框坐标confidence置信度0-1class类别IDname类别名称3.3 处理视频流YOLO-v5同样适用于视频检测import cv2 # 打开摄像头或视频文件 cap cv2.VideoCapture(0) # 0表示默认摄像头 while cap.isOpened(): ret, frame cap.read() if not ret: break # 进行检测 results model(frame) # 显示结果 cv2.imshow(YOLO, np.squeeze(results.render())) if cv2.waitKey(1) 0xFF ord(q): break cap.release() cv2.destroyAllWindows()4. 实用技巧与进阶功能4.1 提高检测精度的小技巧调整置信度阈值model.conf 0.5 # 默认0.25提高可减少误检设置IOU阈值model.iou 0.45 # 默认0.45提高可减少重叠框只检测特定类别model.classes [0, 2] # 只检测人和汽车4.2 使用自定义数据集YOLO-v5支持训练自己的数据集基本流程如下准备图像和标注文件YOLO格式的.txt文件创建数据集配置文件data.yaml开始训练python train.py --img 640 --batch 16 --epochs 50 --data data.yaml --weights yolov5s.pt4.3 模型导出与部署YOLO-v5支持导出多种格式python export.py --weights yolov5s.pt --include torchscript onnx coreml tflite常用导出格式TorchScriptPyTorch原生格式ONNX跨框架通用格式TFLite移动端部署5. 常见问题解答5.1 模型加载失败怎么办问题RuntimeError: Unable to load model解决方案检查网络连接确保能访问GitHub手动下载模型torch.hub.set_dir(/path/to/save) model torch.hub.load(ultralytics/yolov5, yolov5s)5.2 检测速度慢怎么办优化建议使用更小的模型如yolov5n减小输入图像尺寸--img 320启用GPU加速确保CUDA可用使用TensorRT加速高级优化5.3 如何提高小目标检测效果技巧使用更高分辨率的输入--img 1280启用多尺度训练--multi-scale调整anchor大小适合您的数据集增加数据增强mosaic等6. 总结与下一步通过本教程您已经掌握了YOLO-v5的基本使用方法从环境搭建到实际检测应用。YOLO-v5的强大之处在于它的简单易用和高效性能使其成为目标检测领域的首选工具之一。下一步学习建议尝试在自己的数据集上训练模型探索YOLO-v5的高级功能如模型剪枝和量化学习如何将模型部署到移动端或嵌入式设备关注YOLO系列的最新发展如YOLOv6/YOLOv7获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。