【RT-DETR实战】 075、半监督学习在RT-DETR中的应用：用少量标注数据撬动大模型性能

发布时间：2026/5/27 3:37:18

【RT-DETR实战】 075、半监督学习在RT-DETR中的应用：用少量标注数据撬动大模型性能

从实际项目中的困境说起上周在部署RT-DETR到产线缺陷检测场景时，遇到了一个典型问题：产线新上了5种缺陷类型，每种只有不到50张标注样本，直接训练的结果是模型对这些新缺陷的召回率不到30%。标注团队说完整标注需要两周时间，产线等不了那么久。这时候我想到了半监督学习——能不能用大量未标注的产线图像来辅助训练？半监督学习为什么适合RT-DETRRT-DETR作为基于Transformer的检测器，相比传统CNN检测器有个特点：它对数据分布更加敏感。在标注数据不足时，模型容易过拟合到有限的标注样本上，而忽略了真实场景的数据多样性。半监督学习的核心思想就是利用未标注数据来“感知”真实的数据分布。我试过直接加载COCO预训练权重然后微调，效果提升有限。因为COCO的分布和产线缺陷图像差异太大，模型需要“看到”更多当前场景的数据来调整特征提取器。实现方案：伪标签+一致性正则化我采用的方案结合了伪标签和一致性正则化，这是目前工业界比较成熟的半监督检测方案。下面分享核心代码实现：classSemiSupervisedRTDETR: