TGRS 2026 浙大提出 ICAD-UIE:通道间衰减差解水模型,实现保自然度水下图像增强

TGRS 2026  浙大提出 ICAD-UIE:通道间衰减差解水模型,实现保自然度水下图像增强 点击下方“深度学习爱好者”选择加星标或“置顶”水下图像增强一直是计算机视觉领域的热门方向。海洋勘探、水下考古、海上油气作业都离不开清晰的水下视觉数据。但水的吸收和散射作用总会让水下图像出现蓝绿偏色、亮度不足、细节模糊的问题。今天要分享的这篇论文提出了一套兼顾物理合理性和实时性的解决方案——ICAD-UIE框架让水下图像增强不再难。论文信息题目 ICAD-UIE: Naturalness-Ensuring Underwater Image Enhancement With Interchannel Attenuation Difference-Based Dewatering Model基于通道间衰减差异去水模型并确保自然性的水下图像增强方法作者Dongfang Ma, Yun Xu, Fanghao Huang, Zheng Chen源码https://zenodo.org/records/17511319一、水下图像的“老大难”问题先来看一组直观的对比原始水下图像往往存在这些问题从图中能明显看到水下图像不仅视觉上偏蓝绿像素颜色值分布集中红色通道更是几乎挤在低值区域。传统增强方法要么依赖合成数据训练泛化性差要么计算复杂没法实时处理要么校正过度画面失真始终没能完美解决波长相关的衰减问题。二、ICAD-UIE框架给水下图像“精准修色清晰化”这篇论文的核心创新就是打造了一套轻量又高效的ICAD-UIE框架整体结构清晰易懂整个框架围绕四个核心创新点展开每一步都直击水下图像退化的痛点1. 用ICAD矩阵量化通道衰减差异不同波长的光在水下衰减速度不同红光衰减最快蓝绿光相对慢。论文提出的ICAD矩阵能精准衡量RGB三个通道的衰减差异。它以蓝绿通道为基础确定最优参考通道再计算各通道与参考通道的像素差值把衰减程度量化出来。这样一来就能针对不同通道做差异化校正从根源解决色偏问题。2. 定制化去水模型不用复杂参数基于ICAD矩阵作者改造了传统的雾霾退化模型打造了专属的水下去水模型。这个模型不用估计复杂的透射率也不用调一堆外部参数就能同时校正色偏、提升清晰度。它充分考虑水下光传播的特性让图像恢复更贴合物理规律。3. 多色彩空间融合保住画面自然感增强过度是很多方法的通病要么画面过白要么色彩过饱和。这篇论文在HSL和HSB色彩空间里计算融合权重识别原始图像和增强图像的互补区域。比如用HSL的亮度分量判断是否过曝用HSB的饱和度分量保留原始优质区域再把两者自适应融合从图中能看到融合后的图像在HSL三个通道的分布更均匀过度增强的区域被有效修正画面自然感拉满。4. 轻量化设计嵌入式平台也能实时跑整个框架平衡了物理可解释性和计算效率在嵌入式平台处理640×480分辨率的图像时帧率能超过20fps。这意味着它能适配水下机器人这类实时性要求高的场景真正落地到工程应用中。三、实验结果效果看得见数据更能说明问题光说不练假把式我们来看实际的增强效果对比原始图像增强后的画面蓝绿偏色基本消失对比度和亮度显著提升。颜色分布不再集中红色通道也恢复到正常水平细节纹理都清晰可见。再看和其他主流方法的对比不同色彩偏移场景下ICAD-UIE框架的表现都很稳定。对比其他方法它既不会像有些方法那样增强过度、放大噪声也不会出现红移、紫移等新的色偏问题色彩还原更自然细节保留更完整。定量指标上该方法在UIEB、UCCS等主流水下图像数据集上无论是色彩准确性、对比度还是自然感相关的评估指标都表现优异。尤其在“海马冷泉”原位视频测试中能稳定处理实际水下视频流验证了工程部署的潜力。四、总结这篇论文最亮眼的地方是把物理先验和轻量化设计结合得恰到好处。没有依赖复杂的深度学习网络而是从水下光传播的物理特性出发用ICAD矩阵精准捕捉通道衰减差异再通过定制化去水模型和多色彩空间融合既解决了色偏模糊问题又保住了画面的自然感。更难得的是它兼顾了实时性和鲁棒性在不同水色、不同能见度的水下场景中都能稳定发挥嵌入式平台的高帧率表现也让它有了落地应用的底气。对于需要水下视觉支持的海洋工程、科学研究来说这套方法无疑提供了一套高效、可靠的解决方案。水下图像增强的核心从来不是简单的“调亮调艳”而是在还原真实场景的基础上提升视觉质量。这篇论文的思路或许能给相关方向的研究带来新的启发。下载1Pytoch常用函数手册 在「深度学习爱好者」公众号后台回复Pytorch常用函数手册即可下载全网第一份Pytorch常用函数手册涵盖Tensors介绍、基础函数介绍、数据处理函数、优化函数、CUDA编程、多线程处理等十四章章内容。下载2Python视觉实战项目52讲在「小白学视觉」公众号后台回复Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目助力快速学校计算机视觉。交流群 欢迎加入公众号读者群一起和同行交流目前有SLAM、三维视觉驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群以后会逐渐细分请扫描下面微信号加群备注”昵称学校/公司研究方向“例如”张三 上海交大 视觉SLAM“。请按照格式备注否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告否则会请出群谢谢理解~