062、单目深度估计模型部署慢?MiDaS/DPT 加速与深度图后处理工程方案

062、单目深度估计模型部署慢?MiDaS/DPT 加速与深度图后处理工程方案 062、单目深度估计模型部署慢?MiDaS/DPT 加速与深度图后处理工程方案一、从一次现场调试说起上个月帮客户调一个扫地机器人的避障系统,他们用了MiDaS v3.0做深度估计,结果在Jetson Orin上跑640×480输入,帧率只有8fps。客户现场工程师一脸无奈:“模型精度是够了,但机器人撞墙的速度比人走路还快。”我打开他们的代码一看,好家伙,直接拿PyTorch原版MiDaS跑,连TensorRT都没转,后处理还用了OpenCV的cv2.bilateralFilter做双边滤波——这玩意儿在CPU上跑一张图要200ms。典型的“模型选对了,部署全白费”。这种坑我踩过不止一次。单目深度估计模型(MiDaS、DPT、LeReS)在学术benchmark上跑得风生水起,一到嵌入式设备就原形毕露。核心问题不在模型本身,而在工程落地的三个环节:模型推理加速、预处理/后处理优化、深度图质量与速度的平衡。今天这篇笔记,就把我这两年调通十几个单目深度估计部署项目的经验拆开揉碎,从代码层面讲清楚怎么把帧率从个位数拉到30fps以上。二、模型推理加速:别在PyTorch里裸跑2.1 模型选型的第一刀:MiDaS vs DPT先明确一点:MiDaS v3.0(基于Swin-Tiny)和DPT