【YOLO全系列架构演进史】5 YOLOv9:GELAN + PGI 可编程梯度信息流动

【YOLO全系列架构演进史】5 YOLOv9:GELAN + PGI 可编程梯度信息流动 YOLOv9:GELAN + PGI 可编程梯度信息流动1 信息瓶颈:为什么深度网络会"失忆"1.1 从 YOLOv5 到 YOLOv9 的演进脉络1.1.1.1 实时检测的精度天花板我们回顾 YOLO 系列的发展轨迹时,会发现一个有趣的现象:从 YOLOv5 到 YOLOv8,网络结构越来越深,参数量越来越大,但精度的提升却逐渐放缓。这背后隐藏着一个被长期忽视的问题——信息瓶颈。想象一条水管,水流从入口进入,经过层层弯道和阀门后到达出口。如果管道太长,水压必然衰减。深度神经网络也是如此:输入图像携带的丰富信息(边缘、纹理、语义),在经过几十层卷积变换后,大量细节在 forward 传播中丢失;而在 backward 传播时,梯度信号同样层层衰减,早期层收到的更新指令变得模糊而微弱。YOLOv9 的 authors 意识到,单纯堆叠更复杂的模块、设计更精巧的损失函数,都无法从根本上解决这个问题。因为如果网络架构本身在信息传递上存在结构性缺陷,再优秀的优化目标也无法弥补。1.1.1.2 信息瓶颈问题的浮