▒▒本文目录▒▒摘要一、研究背景1.1 散射介质成像的挑战1.2 现有方法的局限性1.3 扩散模型的兴起二、研究方法2.1 扩散模型理论基础2.1.1 前向扩散过程2.1.2 反向扩散采样2.2 分数网络架构2.3 训练策略2.3.1 分数匹配损失2.3.2 指数移动平均2.4 采样策略2.4.1 预测-校正采样器2.4.2 数据一致性约束三、具体实现细节3.1 VESDE实现3.2 网络配置3.3 采样配置3.4 图像重建流程四、实验结果与分析4.1 重建结果展示4.2 结果分析4.2.1 扩散采样过程分析4.2.2 与传统方法对比4.2.3 不同分辨率靶的重建效果4.3 方法优势分析五、讨论与展望5.1 当前方法的局限5.2 未来研究方向六、结论参考文献程序开发摘要散射介质成像是一项具有重大科学意义和广泛应用前景的技术挑战。当光波通过散射介质如雾、生物组织、磨砂玻璃等时会发生多重散射现象导致原始图像信息被严重破坏形成随机散斑图样。本研究探讨了一种基于生成扩散模型的散射介质成像重建方法ISDM通过训练深度神经网络学习图像的分数函数利用反向扩散采样过程从散斑图像中恢复原始目标图像。该方法采用方差爆炸随机微分方程VESDE建模前向扩散过程使用NCSN网络架构估计分数函数结合预测-校正采样策略和数据一致性约束实现高质量图像重建。实验结果表明与传统方法相比该方法在保持结构细节和抑制噪声方面具有显著优势为散射介质成像提供了一种有效的深度学习解决方案。关键词扩散模型散射成像分数匹配随机微分方程深度学习一、研究背景1.1 散射介质成像的挑战散射介质成像在生物医学成像、遥感探测、水下视觉等领域具有重要的应用价值。然而当光波穿过散射介质时会发生复杂的散射现象多重散射效应光子与散射介质中的微粒发生多次碰撞导致传播方向随机改变相位随机化散射介质的折射率不均匀导致光波相位发生随机变化信息编码原始图像信息被编码到复杂的散斑图样中图1散射成像系统示意图。光源发出的光经过目标物体后被散射介质调制形成散斑图样被探测器接收。1.2 现有方法的局限性传统的散射介质成像重建方法主要包括方法类型代表算法主要优点存在局限直接反演法逆矩阵法计算简单对噪声敏感不适定性迭代优化法HIO算法约束灵活收敛慢易陷入局部最优正则化方法TV正则化边缘保持参数敏感纹理丢失深度学习方法CNN/U-Net端到端学习泛化能力有限1.3 扩散模型的兴起近年来基于分数的生成模型在图像生成领域取得了突破性进展Score MatchingSong等人提出通过估计数据分布梯度分数来生成样本扩散概率模型Ho等人提出的DDPM展示了优秀的图像生成能力随机微分方程框架统一了多种生成模型提供了灵活的训练和采样策略图2ISDM训练与重建流程图。训练阶段学习从清晰图像到噪声的扩散过程重建阶段利用学习的分数函数进行反向采样。二、研究方法2.1 扩散模型理论基础2.1.1 前向扩散过程本研究采用方差爆炸随机微分方程VESDE描述前向扩散过程d x σ ( t ) d w dx \sigma(t)dwdxσ(t)dw其中x xx表示图像状态σ ( t ) σ m i n ( σ m a x / σ m i n ) t \sigma(t) \sigma_{min}(\sigma_{max}/\sigma_{min})^tσ(t)σmin(σmax/σmin)t为噪声水平函数w ww表示标准维纳过程边际分布可解析表示为p t ( x ∣ x 0 ) N ( x ; x 0 , σ ( t ) 2 I ) p_t(x|x_0) \mathcal{N}(x; x_0, \sigma(t)^2 I)pt(x∣x0)N(x;x0,σ(t)2I)图3VESDE噪声演化过程。左图展示噪声水平σ(t)随时间呈指数增长中图展示不同时间步的边际分布逐渐展宽右图展示反向采样轨迹。2.1.2 反向扩散采样反向时间SDE可表示为d x [ f ( x , t ) − g 2 ( t ) ∇ x log p t ( x ) ] d t g ( t ) d w ˉ dx [f(x,t) - g^2(t)\nabla_x \log p_t(x)]dt g(t)d\bar{w}dx[f(x,t)−g2(t)∇xlogpt(x)]dtg(t)dwˉ其中∇ x log p t ( x ) \nabla_x \log p_t(x)∇xlogpt(x)称为分数函数需要通过神经网络估计。2.2 分数网络架构本研究采用NCSNNoise Conditional Score Network作为分数估计网络图4NCSN网络架构。采用U-Net结构包含编码器-解码器、跳跃连接和注意力机制。网络特点高斯傅里叶嵌入将时间/噪声水平编码为高维特征渐进式结构多尺度特征提取在16×16分辨率加入注意力机制BigGAN残差块增强梯度流动提高训练稳定性跳跃连接保留细节信息改善重建质量2.3 训练策略2.3.1 分数匹配损失采用去噪分数匹配目标函数L E t , x 0 , ϵ [ λ ( t ) ∥ ∇ x log p t ( x ∣ x 0 ) − s θ ( x , t ) ∥ 2 ] \mathcal{L} \mathbb{E}_{t,x_0,\epsilon}\left[\lambda(t)\|\nabla_x \log p_t(x|x_0) - s_\theta(x,t)\|^2\right]LEt,x0,ϵ[λ(t)∥∇xlogpt(x∣x0)−sθ(x,t)∥2]其中权重函数λ ( t ) 1 σ ( t ) 2 \lambda(t) \frac{1}{\sigma(t)^2}λ(t)σ(t)21图5分数匹配训练过程。左图展示训练损失随迭代次数下降右图展示损失权重随时间的变化。2.3.2 指数移动平均为提高模型稳定性采用EMAExponential Moving Average更新网络参数θ E M A β ⋅ θ E M A ( 1 − β ) ⋅ θ \theta_{EMA} \beta \cdot \theta_{EMA} (1-\beta) \cdot \thetaθEMAβ⋅θEMA(1−β)⋅θ其中衰减率β 0.999 \beta 0.999β0.999。2.4 采样策略2.4.1 预测-校正采样器采用Predictor-Corrector采样策略Predictor步骤反向扩散预测器x t − Δ t x t [ f ( x t , t ) − g 2 ( t ) s θ ( x t , t ) ] Δ t g ( t ) Δ t ϵ x_{t-\Delta t} x_t [f(x_t,t) - g^2(t)s_\theta(x_t,t)]\Delta t g(t)\sqrt{\Delta t}\epsilonxt−Δtxt[f(xt,t)−g2(t)sθ(xt,t)]Δtg(t)ΔtϵCorrector步骤Langevin校正器x x α ⋅ s θ ( x , t ) 2 α ϵ x x \alpha \cdot s_\theta(x,t) \sqrt{2\alpha}\epsilonxxα⋅sθ(x,t)2αϵ其中步长α \alphaα由信噪比(SNR)控制。2.4.2 数据一致性约束在采样过程中加入测量约束x x γ ( t ) ⋅ ( y m e a s u r e d − T ( x ) ) x x \gamma(t) \cdot (y_{measured} - T(x))xxγ(t)⋅(ymeasured−T(x))其中γ ( t ) \gamma(t)γ(t)为随时间递增的约束权重。三、具体实现细节3.1 VESDE实现VESDE参数配置 - sigma_min 0.01 - sigma_max 380 - 离散化步数 N 1000 - 采样终止时间 eps 1e-53.2 网络配置NCSN网络配置 - 基础通道数 nf 128 - 通道倍数 ch_mult (1, 1, 2, 2, 2, 2, 2) - 残差块数量 num_res_blocks 2 - 注意力分辨率 attn_resolutions (16,) - 激活函数Swish - 归一化GroupNorm3.3 采样配置采样参数 - 方法Predictor-Corrector - 预测器ReverseDiffusionPredictor - 校正器LangevinCorrector - 信噪比 SNR 0.16 - 每步校正次数 n_steps 13.4 图像重建流程图6ISDM算法流程示意图。输入图像经过散射介质形成散斑图样分数网络估计梯度信息通过反向扩散采样重建原始图像。重建步骤加载预训练的分数网络模型读取散射介质后的散斑图像从先验分布采样初始噪声图像执行1000步反向扩散采样在每步加入数据一致性约束TV去噪后处理优化结果四、实验结果与分析4.1 重建结果展示图7ISDM图像重建结果。第一行从左至右依次为原始图像、散射后散斑图像、ISDM重建结果、重建误差图第二行展示扩散采样过程从纯噪声逐步恢复图像第三行展示图像范数变化和算法流程。4.2 结果分析4.2.1 扩散采样过程分析从图7的采样过程可视化可以观察到初始阶段t≈1.0图像处于纯噪声状态无明显结构信息中间阶段t≈0.5-0.7开始出现模糊的轮廓和结构后期阶段t≈0.1-0.3细节逐渐清晰噪声被有效抑制最终阶段t≈0获得高质量重建图像4.2.2 与传统方法对比图8不同方法的重建结果对比。(a)USAF分辨率靶(b)散斑图像©LR方法(d)HIO方法(e)TC方法(f)ISDM方法。从对比结果可以看出LR方法重建结果模糊分辨率低HIO方法存在伪影边缘不够锐利TC方法部分细节丢失ISDM方法保持最佳的结构细节和边缘清晰度4.2.3 不同分辨率靶的重建效果目标分辨率特征ISDM PSNR(dB)ISDM SSIM可辨认程度G1E2粗条纹28.50.92完全清晰G1E6中等条纹25.30.88清晰可辨G2E5细条纹22.10.82基本可辨G3E2极细条纹18.70.75部分可辨4.3 方法优势分析1. 生成式建模优势学习数据分布而非直接映射能够处理不适定逆问题生成多样化的合理解2. 渐进式采样优势从粗到细的重建过程自然地结合多尺度信息避免局部最优陷阱3. 数据一致性约束优势充分利用测量信息提高重建准确性增强物理可解释性五、讨论与展望5.1 当前方法的局限计算效率1000步采样过程耗时较长需要优化采样策略训练数据依赖需要大量配对的训练数据泛化能力对不同散射介质的适应性有待验证5.2 未来研究方向加速采样研究一致性模型、蒸馏技术等加速方法零样本/少样本学习减少对训练数据的依赖多模态融合结合深度信息、光谱信息等实时处理开发高效的硬件加速方案六、结论本研究详细介绍了基于生成扩散模型的散射介质成像重建方法ISDM。该方法通过VESDE建模前向扩散过程采用NCSN网络学习分数函数结合预测-校正采样策略和数据一致性约束实现了从散斑图像到原始图像的高质量重建。实验结果表明与传统方法相比ISDM在保持结构细节、抑制噪声和处理复杂场景方面具有显著优势。该方法为散射介质成像提供了一种有效的深度学习解决方案在生物医学成像、遥感探测等领域具有广阔的应用前景。参考文献Song, Y., et al. “Score-Based Generative Modeling through Stochastic Differential Equations.” ICLR 2021.Ho, J., et al. “Denoising Diffusion Probabilistic Models.” NeurIPS 2020.Song, Y., Ermon, S. “Generative Modeling by Estimating Gradients of the Data Distribution.” NeurIPS 2019.Chen, Z., et al. “Imaging through scattering media via generative diffusion model.” Applied Physics Letters, 2024.报告生成日期2026年3月20日程序开发博主博士研究生️: easy_optics在光学检测领域可提供实验指导、程序开发、申博指导、论文指导。⭐️◎⭐️◎⭐️◎⭐️ · · ·**博 主 简 介**· · · ⭐️◎⭐️◎⭐️◎⭐️♪▁▂▃▅▆▇博士研究生研究方向主要涉及定量相位成像领域具体包括干涉相位成像技术(如**全息干涉☑**、散斑干涉☑等)、非干涉法相位成像技术(如波前传感技术☑相位恢复技术☑)、条纹投影轮廓术(相位测量偏折术)、此外还对各种相位解包裹算法☑相干噪声去除算法☑衍射光学神经网络☑等开展过深入的研究。程序获取、程序开发、实验指导软硬系统开发科研服务申博指导️easy_optics或如下。
ISDM: 基于生成扩散模型的散射介质成像重建技术报告
▒▒本文目录▒▒摘要一、研究背景1.1 散射介质成像的挑战1.2 现有方法的局限性1.3 扩散模型的兴起二、研究方法2.1 扩散模型理论基础2.1.1 前向扩散过程2.1.2 反向扩散采样2.2 分数网络架构2.3 训练策略2.3.1 分数匹配损失2.3.2 指数移动平均2.4 采样策略2.4.1 预测-校正采样器2.4.2 数据一致性约束三、具体实现细节3.1 VESDE实现3.2 网络配置3.3 采样配置3.4 图像重建流程四、实验结果与分析4.1 重建结果展示4.2 结果分析4.2.1 扩散采样过程分析4.2.2 与传统方法对比4.2.3 不同分辨率靶的重建效果4.3 方法优势分析五、讨论与展望5.1 当前方法的局限5.2 未来研究方向六、结论参考文献程序开发摘要散射介质成像是一项具有重大科学意义和广泛应用前景的技术挑战。当光波通过散射介质如雾、生物组织、磨砂玻璃等时会发生多重散射现象导致原始图像信息被严重破坏形成随机散斑图样。本研究探讨了一种基于生成扩散模型的散射介质成像重建方法ISDM通过训练深度神经网络学习图像的分数函数利用反向扩散采样过程从散斑图像中恢复原始目标图像。该方法采用方差爆炸随机微分方程VESDE建模前向扩散过程使用NCSN网络架构估计分数函数结合预测-校正采样策略和数据一致性约束实现高质量图像重建。实验结果表明与传统方法相比该方法在保持结构细节和抑制噪声方面具有显著优势为散射介质成像提供了一种有效的深度学习解决方案。关键词扩散模型散射成像分数匹配随机微分方程深度学习一、研究背景1.1 散射介质成像的挑战散射介质成像在生物医学成像、遥感探测、水下视觉等领域具有重要的应用价值。然而当光波穿过散射介质时会发生复杂的散射现象多重散射效应光子与散射介质中的微粒发生多次碰撞导致传播方向随机改变相位随机化散射介质的折射率不均匀导致光波相位发生随机变化信息编码原始图像信息被编码到复杂的散斑图样中图1散射成像系统示意图。光源发出的光经过目标物体后被散射介质调制形成散斑图样被探测器接收。1.2 现有方法的局限性传统的散射介质成像重建方法主要包括方法类型代表算法主要优点存在局限直接反演法逆矩阵法计算简单对噪声敏感不适定性迭代优化法HIO算法约束灵活收敛慢易陷入局部最优正则化方法TV正则化边缘保持参数敏感纹理丢失深度学习方法CNN/U-Net端到端学习泛化能力有限1.3 扩散模型的兴起近年来基于分数的生成模型在图像生成领域取得了突破性进展Score MatchingSong等人提出通过估计数据分布梯度分数来生成样本扩散概率模型Ho等人提出的DDPM展示了优秀的图像生成能力随机微分方程框架统一了多种生成模型提供了灵活的训练和采样策略图2ISDM训练与重建流程图。训练阶段学习从清晰图像到噪声的扩散过程重建阶段利用学习的分数函数进行反向采样。二、研究方法2.1 扩散模型理论基础2.1.1 前向扩散过程本研究采用方差爆炸随机微分方程VESDE描述前向扩散过程d x σ ( t ) d w dx \sigma(t)dwdxσ(t)dw其中x xx表示图像状态σ ( t ) σ m i n ( σ m a x / σ m i n ) t \sigma(t) \sigma_{min}(\sigma_{max}/\sigma_{min})^tσ(t)σmin(σmax/σmin)t为噪声水平函数w ww表示标准维纳过程边际分布可解析表示为p t ( x ∣ x 0 ) N ( x ; x 0 , σ ( t ) 2 I ) p_t(x|x_0) \mathcal{N}(x; x_0, \sigma(t)^2 I)pt(x∣x0)N(x;x0,σ(t)2I)图3VESDE噪声演化过程。左图展示噪声水平σ(t)随时间呈指数增长中图展示不同时间步的边际分布逐渐展宽右图展示反向采样轨迹。2.1.2 反向扩散采样反向时间SDE可表示为d x [ f ( x , t ) − g 2 ( t ) ∇ x log p t ( x ) ] d t g ( t ) d w ˉ dx [f(x,t) - g^2(t)\nabla_x \log p_t(x)]dt g(t)d\bar{w}dx[f(x,t)−g2(t)∇xlogpt(x)]dtg(t)dwˉ其中∇ x log p t ( x ) \nabla_x \log p_t(x)∇xlogpt(x)称为分数函数需要通过神经网络估计。2.2 分数网络架构本研究采用NCSNNoise Conditional Score Network作为分数估计网络图4NCSN网络架构。采用U-Net结构包含编码器-解码器、跳跃连接和注意力机制。网络特点高斯傅里叶嵌入将时间/噪声水平编码为高维特征渐进式结构多尺度特征提取在16×16分辨率加入注意力机制BigGAN残差块增强梯度流动提高训练稳定性跳跃连接保留细节信息改善重建质量2.3 训练策略2.3.1 分数匹配损失采用去噪分数匹配目标函数L E t , x 0 , ϵ [ λ ( t ) ∥ ∇ x log p t ( x ∣ x 0 ) − s θ ( x , t ) ∥ 2 ] \mathcal{L} \mathbb{E}_{t,x_0,\epsilon}\left[\lambda(t)\|\nabla_x \log p_t(x|x_0) - s_\theta(x,t)\|^2\right]LEt,x0,ϵ[λ(t)∥∇xlogpt(x∣x0)−sθ(x,t)∥2]其中权重函数λ ( t ) 1 σ ( t ) 2 \lambda(t) \frac{1}{\sigma(t)^2}λ(t)σ(t)21图5分数匹配训练过程。左图展示训练损失随迭代次数下降右图展示损失权重随时间的变化。2.3.2 指数移动平均为提高模型稳定性采用EMAExponential Moving Average更新网络参数θ E M A β ⋅ θ E M A ( 1 − β ) ⋅ θ \theta_{EMA} \beta \cdot \theta_{EMA} (1-\beta) \cdot \thetaθEMAβ⋅θEMA(1−β)⋅θ其中衰减率β 0.999 \beta 0.999β0.999。2.4 采样策略2.4.1 预测-校正采样器采用Predictor-Corrector采样策略Predictor步骤反向扩散预测器x t − Δ t x t [ f ( x t , t ) − g 2 ( t ) s θ ( x t , t ) ] Δ t g ( t ) Δ t ϵ x_{t-\Delta t} x_t [f(x_t,t) - g^2(t)s_\theta(x_t,t)]\Delta t g(t)\sqrt{\Delta t}\epsilonxt−Δtxt[f(xt,t)−g2(t)sθ(xt,t)]Δtg(t)ΔtϵCorrector步骤Langevin校正器x x α ⋅ s θ ( x , t ) 2 α ϵ x x \alpha \cdot s_\theta(x,t) \sqrt{2\alpha}\epsilonxxα⋅sθ(x,t)2αϵ其中步长α \alphaα由信噪比(SNR)控制。2.4.2 数据一致性约束在采样过程中加入测量约束x x γ ( t ) ⋅ ( y m e a s u r e d − T ( x ) ) x x \gamma(t) \cdot (y_{measured} - T(x))xxγ(t)⋅(ymeasured−T(x))其中γ ( t ) \gamma(t)γ(t)为随时间递增的约束权重。三、具体实现细节3.1 VESDE实现VESDE参数配置 - sigma_min 0.01 - sigma_max 380 - 离散化步数 N 1000 - 采样终止时间 eps 1e-53.2 网络配置NCSN网络配置 - 基础通道数 nf 128 - 通道倍数 ch_mult (1, 1, 2, 2, 2, 2, 2) - 残差块数量 num_res_blocks 2 - 注意力分辨率 attn_resolutions (16,) - 激活函数Swish - 归一化GroupNorm3.3 采样配置采样参数 - 方法Predictor-Corrector - 预测器ReverseDiffusionPredictor - 校正器LangevinCorrector - 信噪比 SNR 0.16 - 每步校正次数 n_steps 13.4 图像重建流程图6ISDM算法流程示意图。输入图像经过散射介质形成散斑图样分数网络估计梯度信息通过反向扩散采样重建原始图像。重建步骤加载预训练的分数网络模型读取散射介质后的散斑图像从先验分布采样初始噪声图像执行1000步反向扩散采样在每步加入数据一致性约束TV去噪后处理优化结果四、实验结果与分析4.1 重建结果展示图7ISDM图像重建结果。第一行从左至右依次为原始图像、散射后散斑图像、ISDM重建结果、重建误差图第二行展示扩散采样过程从纯噪声逐步恢复图像第三行展示图像范数变化和算法流程。4.2 结果分析4.2.1 扩散采样过程分析从图7的采样过程可视化可以观察到初始阶段t≈1.0图像处于纯噪声状态无明显结构信息中间阶段t≈0.5-0.7开始出现模糊的轮廓和结构后期阶段t≈0.1-0.3细节逐渐清晰噪声被有效抑制最终阶段t≈0获得高质量重建图像4.2.2 与传统方法对比图8不同方法的重建结果对比。(a)USAF分辨率靶(b)散斑图像©LR方法(d)HIO方法(e)TC方法(f)ISDM方法。从对比结果可以看出LR方法重建结果模糊分辨率低HIO方法存在伪影边缘不够锐利TC方法部分细节丢失ISDM方法保持最佳的结构细节和边缘清晰度4.2.3 不同分辨率靶的重建效果目标分辨率特征ISDM PSNR(dB)ISDM SSIM可辨认程度G1E2粗条纹28.50.92完全清晰G1E6中等条纹25.30.88清晰可辨G2E5细条纹22.10.82基本可辨G3E2极细条纹18.70.75部分可辨4.3 方法优势分析1. 生成式建模优势学习数据分布而非直接映射能够处理不适定逆问题生成多样化的合理解2. 渐进式采样优势从粗到细的重建过程自然地结合多尺度信息避免局部最优陷阱3. 数据一致性约束优势充分利用测量信息提高重建准确性增强物理可解释性五、讨论与展望5.1 当前方法的局限计算效率1000步采样过程耗时较长需要优化采样策略训练数据依赖需要大量配对的训练数据泛化能力对不同散射介质的适应性有待验证5.2 未来研究方向加速采样研究一致性模型、蒸馏技术等加速方法零样本/少样本学习减少对训练数据的依赖多模态融合结合深度信息、光谱信息等实时处理开发高效的硬件加速方案六、结论本研究详细介绍了基于生成扩散模型的散射介质成像重建方法ISDM。该方法通过VESDE建模前向扩散过程采用NCSN网络学习分数函数结合预测-校正采样策略和数据一致性约束实现了从散斑图像到原始图像的高质量重建。实验结果表明与传统方法相比ISDM在保持结构细节、抑制噪声和处理复杂场景方面具有显著优势。该方法为散射介质成像提供了一种有效的深度学习解决方案在生物医学成像、遥感探测等领域具有广阔的应用前景。参考文献Song, Y., et al. “Score-Based Generative Modeling through Stochastic Differential Equations.” ICLR 2021.Ho, J., et al. “Denoising Diffusion Probabilistic Models.” NeurIPS 2020.Song, Y., Ermon, S. “Generative Modeling by Estimating Gradients of the Data Distribution.” NeurIPS 2019.Chen, Z., et al. “Imaging through scattering media via generative diffusion model.” Applied Physics Letters, 2024.报告生成日期2026年3月20日程序开发博主博士研究生️: easy_optics在光学检测领域可提供实验指导、程序开发、申博指导、论文指导。⭐️◎⭐️◎⭐️◎⭐️ · · ·**博 主 简 介**· · · ⭐️◎⭐️◎⭐️◎⭐️♪▁▂▃▅▆▇博士研究生研究方向主要涉及定量相位成像领域具体包括干涉相位成像技术(如**全息干涉☑**、散斑干涉☑等)、非干涉法相位成像技术(如波前传感技术☑相位恢复技术☑)、条纹投影轮廓术(相位测量偏折术)、此外还对各种相位解包裹算法☑相干噪声去除算法☑衍射光学神经网络☑等开展过深入的研究。程序获取、程序开发、实验指导软硬系统开发科研服务申博指导️easy_optics或如下。