DitHub：把目标检测做成“Git 分支管理”-尧图企业网站定制

DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection一句话先说结论DitHub 这篇论文最有意思的地方，不是把检测器“再训强一点”，而是换了个思路：把新知识拆成一个个小模块来管理。以后模型学会“狗”“热成像中的人”“稀有蘑菇”，不一定要全塞进同一套权重里，而是像 Git 一样，给每个类别或任务维护自己的“分支”，需要的时候再 fetch、再 merge。论文作者发现，这种方式不仅更灵活，而且在增量开放词表检测上效果还真更好，在 ODinW-13 和他们新建的 ODinW-O 上都拿到了 SOTA。1. 这篇论文想解决什么问题？先解释一下背景。传统目标检测一般是“封闭类别”的：猫狗车人这些类别，训练前就定好了。而开放词表检测不一样，它允许你在推理时直接输入文本提示，比如“axolotl（美西螈）”“thermal person（热成像中的人）”，模型也要尽量把目标找出来。这类方法通常建立在视觉-语言预训练模型之上，比如 GLIP、Grounding DINO。问题来了：虽然这类模型零样本泛化很强，但要把它持续用于真实世界，就会遇到一个很烦的事：今天你想让它更会识别“蘑菇”明天你又想增强“热成像中的人”后天又想补一个很少见的新类别很多现有方法的做法是：把新知识继续压进同一套权重里。论文把这种方式叫 monolithic adaptation（单体式适配）。它的问题很像：你把所有项目都写进一个超大的单文件脚本里，短期能跑，长期就会越来越难维护。某个类别想单独升级、回退、删除，都会变得很别扭，而且不同知识之间还可能互相干扰。2. DitHub 的核心想法：别把知识都塞

相关新闻

【机器学习中的数据泄露：你必须知道的事】

GaussDB新手必看：5分钟搞定gsql连接与常用命令速查（附实战示例）

Web安全之web基础

保姆级教程：手把手教你用Autosar MCAL的ICU模块测量PWM占空比（基于SignalMeasurement模式）

【进阶功能】直角弯道识别与定点旋转机动——从差速控制到定点转向

C++低延迟优化十大黑科技

Ubuntu 24.04 安装 Fcitx5 拼音输入法教程

JMeter接口与压力测试实战：从连通性校验到性能瓶颈定位

LightGBM怎么做：SPSSAU软件操作步骤与结果指标解读

Unity ML-Agents 环境配置避坑指南：Python+CUDA+Unity 版本精准匹配

毕业设计 yolov11骨折检测医疗辅助系统（源码+论文）

别再死记硬背了！用5个生活化比喻彻底搞懂Linux进程的fork、exec和wait

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势