【RT-DETR实战】 075、半监督学习在RT-DETR中的应用:用少量标注数据撬动大模型性能

【RT-DETR实战】 075、半监督学习在RT-DETR中的应用:用少量标注数据撬动大模型性能 从实际项目中的困境说起上周在部署RT-DETR到产线缺陷检测场景时,遇到了一个典型问题:产线新上了5种缺陷类型,每种只有不到50张标注样本,直接训练的结果是模型对这些新缺陷的召回率不到30%。标注团队说完整标注需要两周时间,产线等不了那么久。这时候我想到了半监督学习——能不能用大量未标注的产线图像来辅助训练?半监督学习为什么适合RT-DETRRT-DETR作为基于Transformer的检测器,相比传统CNN检测器有个特点:它对数据分布更加敏感。在标注数据不足时,模型容易过拟合到有限的标注样本上,而忽略了真实场景的数据多样性。半监督学习的核心思想就是利用未标注数据来“感知”真实的数据分布。我试过直接加载COCO预训练权重然后微调,效果提升有限。因为COCO的分布和产线缺陷图像差异太大,模型需要“看到”更多当前场景的数据来调整特征提取器。实现方案:伪标签+一致性正则化我采用的方案结合了伪标签和一致性正则化,这是目前工业界比较成熟的半监督检测方案。下面分享核心代码实现:classSemiSupervisedRTDETR: