摘要多目标跟踪( MOT )在各种计算机视觉领域中起着关键作用最近的检测跟踪算法将MOT视为不同的检测和关联任务。然而现有的跟踪器在跨视频形成完整轨迹的同时往往依赖于敏感阈值来关联先前的轨迹和当前的检测结果。这些阈值对跟踪性能至关重要并且需要对每个数据集甚至序列进行手动调整限制了在实际应用中的适应性。为了解决这个问题在本文中我们引入了AdapTrack一种新的MOT算法它可以在不需要手动设置阈值的情况下适应变化的场景。 通过精心设计的匹配策略我们的跟踪器可以为每一帧自适应地选择适当的阈值并正确地关联检测到的物体。因此与现有最先进的方法相比Adap Track在标准的MOT基准测试集MOT17和MOT20上表现优异。我们的贡献总结如下。1我们推出AdapTrack-一种基于检测式跟踪的新型运动目标追踪算法能够在关联过程中自适应调整匹配阈值。这种自适应阈值设定方法无需手动配置阈值有效解决了阈值设置固有的敏感性问题并提升了该算法在多种场景下的跟踪性能。2我们提出的方法采用了一种精心设计的匹配策略该策略仅涉及负样本过滤和自适应阈值处理且计算开销极低。3我们的跟踪系统在多种跟踪场景中展现出卓越的适应性和稳健性在MOT17和MOT20数据集上均取得领先成果有效应对了不同跟踪环境带来的挑战。1、代码和数据集1.1 论文代码https://github. com / kamkyu94 / Adap Track1.2 数据集MOT17和MOT202、要解决的问题近年来基于TBD的跟踪器凭借其卓越性能成为主流选择--这类跟踪器通过二分匹配及其估算的成对亲和力在时间轴上依次连接检测结果。然而它们在关联过程中通常依赖敏感阈值来避免不同对象之间的错误匹配。这些阈值往往显著影响跟踪性能需要针对不同场景进行精细调整。例如图1中各序列最优阈值值的巨大差异充分体现了其固有的敏感性。尽管如此在大多数情况下匹配阈值仍需手动设置而考虑到MOT场景中广阔且不可预测的开放世界特性这种人工设定在实际应用中可能引发严重问题。3、提出的创新点我们推出了一款基于TB数据库的创新MOT追踪器AdapTrack该工具能够动态处理多种追踪场景无需手动设置阈值。通过采用由负样本过滤和自适应阈值设定构成的新型匹配策略我们的追踪器能够在每个帧的关联处理过程中自适应地确定合适的阈值。具体而言在过滤阶段我们首先会战略性地剔除可能干扰后续自适应阈值设定过程的噪声距离值;随后在自适应阈值设定阶段通过对过滤后的距离值进行分析并引入极化锚点值及聚类技术来确定最优阈值。3.1 方法我们提出的MOT算法分为多个步骤进行。首先,我们在 当前帧中检测感兴趣对象,其中第 i 个检测结果表示为,包含边界框位置、提取的外观特征以及置信度评分。随后,我们计算一组检测结果与现有轨迹集之间的成对距离;每个轨迹(记为)由其外观特征及 对应的检测结果集合共同构成,并持续更新。最后,通过使用新的匹配策略我们根据自适应确定的阈值和计算的距离将检测结果与相应的轨道进行适当的关联。3.2 匹配策略如图1和图2所示由于环境因素(包括相机和物体的运动)频繁变化用于排除检测结果与轨迹之间错误配对(即负样本配对)关联所需的阈值需要针对每个视频甚至每帧画面持续调整。然而现有多种方法仍存在依赖手动设定匹配阈值的局限性这在实际应用场景中可能带来显著挑战。为解决这一问题我们提出了一种可根据具体跟踪场景灵活调整的新型匹配策略。该策略通过两个独立阶段--负样本过滤与自适应阈值设定--使我们在每帧匹配过程中都能动态选择合适的阈值。在第一阶段我们剔除源自潜在负样本配对的距离值。随后在第二阶段我们根据负值对之间的距离通常大于正值对之间距离这一固有规律将剩余距离值分为两组从而确定合适的阈值。3.2.1 负值过滤在我们分析检测结果和现有轨迹之间的成对距离以自适应地找到一个适当的阈值来分离正负关联之前我们首先发现并过滤掉从明显的负对中计算的距离值。由于大多数距离不可避免地对应于负对因此这种主动滤波过程可以在随后的自适应阈值阶段最大限度地减少噪声值的潜在干扰并通过减少所考虑的目标数量来简化后续阶段。尽管该滤波阶段的实现方式可能不同但在我们的Adap Track中考虑到算法的简洁性我们在计算的距离中引入了空间约束。 更具体地说当我们使用外观特征之间的余弦距离计算距离时我们通过将没有任何空间重叠的对的距离值替换为它们的IoU距离来实现这个过滤阶段即这种情况下的IoU距离。这种过滤过程还可以通过拒绝具有高相似度但空间距离较远的配对之间的匹配来显著降低错误关联的风险。3.2.2 自适应阈值处理在这个阶段我们分析距离的过滤值并自适应地确定适当的阈值来区分负关联和正关联。首先我们在过滤后的距离集合中引入两个新的极化锚值并将超出范围的锚值丢弃到添加的锚值中。两个锚值分别被分配为当前距离度量的可能最小值和滤波前的最大距离值。然后我们利用正对之间的距离大多低于负对之间的距离这一固有特性将距离值聚为两组。注入的锚值作为聚类开始的初始点。 最后基于聚类结果我们设定阈值为正组的最大距离分数。3.3 AdapTrack算法1给出了我们提出的Adap Track的伪代码。在整个输入视频中我们首先检测当前帧中的物体(第4行)并使用Kalman滤波器(第7 ~ 9行)更新轨迹及其预测的后续位置。随后我们计算O和K之间的距离矩阵其中和分别表示外观特征的余弦距离和基于卡尔曼状态的马氏距离的矩阵(第12行)。在负值过滤后自适应地选择匹配阈值并通过基于成对距离的二分匹配和匈牙利算法将每个轨道与相应的检测结果相关联只有当它们的距离小于( 13 ~ 16)。 此外我们计算和之间的IoU距离只有当匹配对的距离低于阈值时才将它们关联起来这也是自适应确定的(线23 ~ 26)。最后将剩余的检测结果初始化为新的航迹(第32行)并使用与前文工作类似的对应匹配检测结果的特征更新匹配后的第 j 个航迹的外观特征。4、结论与不足尽管基于检测的跟踪算法凭借卓越性能长期主导运动目标跟踪领域,但其对敏感阈值的固有依赖性仍带来诸多挑战,阻碍了实际应用。为解决这一问题,我们提出了一种名为AdapTrack的创新算法——该算法能够适应动态跟踪场景,同时无需人工配置阈值。通过采用包含负样本过滤和自适应阈值设定的新型匹配策略,我们的跟踪系统可为每帧图像自动确定合适的阈值,从而提升在不同环境下的跟踪性能。经过大量分析与消融实验验证,该算法在MOT17和MOT20数据集上均展现出超越行 业平均水平的性能优势。凭借其强大的鲁棒性和灵活性,AdapTrack为实际应用场景提供了更为可靠且灵活的解决方案。
16-ADAPTRACK:基于自适应阈值的多目标跟踪匹配算法
摘要多目标跟踪( MOT )在各种计算机视觉领域中起着关键作用最近的检测跟踪算法将MOT视为不同的检测和关联任务。然而现有的跟踪器在跨视频形成完整轨迹的同时往往依赖于敏感阈值来关联先前的轨迹和当前的检测结果。这些阈值对跟踪性能至关重要并且需要对每个数据集甚至序列进行手动调整限制了在实际应用中的适应性。为了解决这个问题在本文中我们引入了AdapTrack一种新的MOT算法它可以在不需要手动设置阈值的情况下适应变化的场景。 通过精心设计的匹配策略我们的跟踪器可以为每一帧自适应地选择适当的阈值并正确地关联检测到的物体。因此与现有最先进的方法相比Adap Track在标准的MOT基准测试集MOT17和MOT20上表现优异。我们的贡献总结如下。1我们推出AdapTrack-一种基于检测式跟踪的新型运动目标追踪算法能够在关联过程中自适应调整匹配阈值。这种自适应阈值设定方法无需手动配置阈值有效解决了阈值设置固有的敏感性问题并提升了该算法在多种场景下的跟踪性能。2我们提出的方法采用了一种精心设计的匹配策略该策略仅涉及负样本过滤和自适应阈值处理且计算开销极低。3我们的跟踪系统在多种跟踪场景中展现出卓越的适应性和稳健性在MOT17和MOT20数据集上均取得领先成果有效应对了不同跟踪环境带来的挑战。1、代码和数据集1.1 论文代码https://github. com / kamkyu94 / Adap Track1.2 数据集MOT17和MOT202、要解决的问题近年来基于TBD的跟踪器凭借其卓越性能成为主流选择--这类跟踪器通过二分匹配及其估算的成对亲和力在时间轴上依次连接检测结果。然而它们在关联过程中通常依赖敏感阈值来避免不同对象之间的错误匹配。这些阈值往往显著影响跟踪性能需要针对不同场景进行精细调整。例如图1中各序列最优阈值值的巨大差异充分体现了其固有的敏感性。尽管如此在大多数情况下匹配阈值仍需手动设置而考虑到MOT场景中广阔且不可预测的开放世界特性这种人工设定在实际应用中可能引发严重问题。3、提出的创新点我们推出了一款基于TB数据库的创新MOT追踪器AdapTrack该工具能够动态处理多种追踪场景无需手动设置阈值。通过采用由负样本过滤和自适应阈值设定构成的新型匹配策略我们的追踪器能够在每个帧的关联处理过程中自适应地确定合适的阈值。具体而言在过滤阶段我们首先会战略性地剔除可能干扰后续自适应阈值设定过程的噪声距离值;随后在自适应阈值设定阶段通过对过滤后的距离值进行分析并引入极化锚点值及聚类技术来确定最优阈值。3.1 方法我们提出的MOT算法分为多个步骤进行。首先,我们在 当前帧中检测感兴趣对象,其中第 i 个检测结果表示为,包含边界框位置、提取的外观特征以及置信度评分。随后,我们计算一组检测结果与现有轨迹集之间的成对距离;每个轨迹(记为)由其外观特征及 对应的检测结果集合共同构成,并持续更新。最后,通过使用新的匹配策略我们根据自适应确定的阈值和计算的距离将检测结果与相应的轨道进行适当的关联。3.2 匹配策略如图1和图2所示由于环境因素(包括相机和物体的运动)频繁变化用于排除检测结果与轨迹之间错误配对(即负样本配对)关联所需的阈值需要针对每个视频甚至每帧画面持续调整。然而现有多种方法仍存在依赖手动设定匹配阈值的局限性这在实际应用场景中可能带来显著挑战。为解决这一问题我们提出了一种可根据具体跟踪场景灵活调整的新型匹配策略。该策略通过两个独立阶段--负样本过滤与自适应阈值设定--使我们在每帧匹配过程中都能动态选择合适的阈值。在第一阶段我们剔除源自潜在负样本配对的距离值。随后在第二阶段我们根据负值对之间的距离通常大于正值对之间距离这一固有规律将剩余距离值分为两组从而确定合适的阈值。3.2.1 负值过滤在我们分析检测结果和现有轨迹之间的成对距离以自适应地找到一个适当的阈值来分离正负关联之前我们首先发现并过滤掉从明显的负对中计算的距离值。由于大多数距离不可避免地对应于负对因此这种主动滤波过程可以在随后的自适应阈值阶段最大限度地减少噪声值的潜在干扰并通过减少所考虑的目标数量来简化后续阶段。尽管该滤波阶段的实现方式可能不同但在我们的Adap Track中考虑到算法的简洁性我们在计算的距离中引入了空间约束。 更具体地说当我们使用外观特征之间的余弦距离计算距离时我们通过将没有任何空间重叠的对的距离值替换为它们的IoU距离来实现这个过滤阶段即这种情况下的IoU距离。这种过滤过程还可以通过拒绝具有高相似度但空间距离较远的配对之间的匹配来显著降低错误关联的风险。3.2.2 自适应阈值处理在这个阶段我们分析距离的过滤值并自适应地确定适当的阈值来区分负关联和正关联。首先我们在过滤后的距离集合中引入两个新的极化锚值并将超出范围的锚值丢弃到添加的锚值中。两个锚值分别被分配为当前距离度量的可能最小值和滤波前的最大距离值。然后我们利用正对之间的距离大多低于负对之间的距离这一固有特性将距离值聚为两组。注入的锚值作为聚类开始的初始点。 最后基于聚类结果我们设定阈值为正组的最大距离分数。3.3 AdapTrack算法1给出了我们提出的Adap Track的伪代码。在整个输入视频中我们首先检测当前帧中的物体(第4行)并使用Kalman滤波器(第7 ~ 9行)更新轨迹及其预测的后续位置。随后我们计算O和K之间的距离矩阵其中和分别表示外观特征的余弦距离和基于卡尔曼状态的马氏距离的矩阵(第12行)。在负值过滤后自适应地选择匹配阈值并通过基于成对距离的二分匹配和匈牙利算法将每个轨道与相应的检测结果相关联只有当它们的距离小于( 13 ~ 16)。 此外我们计算和之间的IoU距离只有当匹配对的距离低于阈值时才将它们关联起来这也是自适应确定的(线23 ~ 26)。最后将剩余的检测结果初始化为新的航迹(第32行)并使用与前文工作类似的对应匹配检测结果的特征更新匹配后的第 j 个航迹的外观特征。4、结论与不足尽管基于检测的跟踪算法凭借卓越性能长期主导运动目标跟踪领域,但其对敏感阈值的固有依赖性仍带来诸多挑战,阻碍了实际应用。为解决这一问题,我们提出了一种名为AdapTrack的创新算法——该算法能够适应动态跟踪场景,同时无需人工配置阈值。通过采用包含负样本过滤和自适应阈值设定的新型匹配策略,我们的跟踪系统可为每帧图像自动确定合适的阈值,从而提升在不同环境下的跟踪性能。经过大量分析与消融实验验证,该算法在MOT17和MOT20数据集上均展现出超越行 业平均水平的性能优势。凭借其强大的鲁棒性和灵活性,AdapTrack为实际应用场景提供了更为可靠且灵活的解决方案。