078.半监督学习：利用少量标注数据和大量无标签数据训练YOLO-尧图企业网站定制

上周在产线部署缺陷检测模型，遇到个头疼事：新产线只收集到200张标注图，但历史无标签数据有2万张。客户问：“能不能用上那堆没标的数据？” 这问题直接戳中工业场景的痛点——标注成本高、周期长。今天聊聊我们怎么用半监督学习，让YOLO既吃“细粮”也啃“粗粮”。一、从伪标签迭代开始：别指望一步到位刚开始想得太简单：直接用有标签数据训个初始模型，去预测无标签数据，把高置信度的预测框当作真值，混回训练集再训。结果第一轮就崩了——初始模型在无标签数据上误检严重，噪声标签把模型带偏了，mAP掉了5个点。教训：伪标签的质量比数量重要。我们改成了三步迭代法：用有标签数据训练一个“保守模型”（提高置信度阈值，严格数据增强）。对无标签数据做强增强（Mosaic+RandAugment）预测，只保留最高置信度的10%预测框。混合训练时，给伪标签样本设置更低的损失权重（0.3左右）。# 伪标签生成核心片段forunlab_imginunlabeled_dataset:# 强增强版本用于预测

相关新闻

图像生成-图像自回归建模发展概述2022-2026

鸿蒙中的自由流转

输出函数print

从云台控制理解双环PID：手把手调试大疆GM6020电机的角度与速度环

反激式开关电源电路测试记录（二）

vscode eide从空项目建立stm32的armclang编译的项目

windows8080端口被占用 ？

智慧树刷课插件：3个功能让你告别手动操作，节省50%学习时间

Marginalia代码实现原理：深入理解SQL查询注释的内部工作机制

状态机——SpringStateMachine嵌套状态流转

终极Windows 11优化指南：如何用开源工具彻底清理系统冗余

利用TaoToken模型广场为不同文本处理任务选择性价比最优模型

基于CircuitPython与运动传感器的智能LED滑雪板灯光系统全解析

app扫描wifi的时候需要打开GPS定位----否则扫不到

使用辅助权限登录wifi

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

windows8080端口被占用？