【视觉目标跟踪最高峰】VOT Challenge 2017 亚军北邮团队技术分享

随着深度学习在计算机视觉方面大放异彩，近几年物体追踪也得到了飞速的发展。物体追踪解决的问题是在一段时间内对于同一个物体在复杂的背景下（如遮挡，光照，物体旋转等），进行持续高速的跟踪。因此，物体追踪是监控，安防，自动驾驶，无人机，智能家居等应用中必须解决的关键课题。lQo鹿先生侃娱乐

作为视觉跟踪领域的最高峰，Visual-Object-Tracking Challenge (VOT) 是国际目标跟踪领域最权威的测评平台，由伯明翰大学、卢布尔雅那大学、布拉格捷克技术大学、奥地利科技学院联合创办，旨在评测在复杂场景下单目标短时跟踪的算法性能。由于每年的评测序列都会更新，且标注的精确度一年一年提高，VOT竞赛也被视为视觉跟踪领域最难的竞赛，远远超过了其他数据集。因此，每年最好的追踪算法都会在上面一展拳脚，在激烈的比拼中擦出灵感的火花。lQo鹿先生侃娱乐

今年的比赛 VOT 2017，作为 ICCV 2017的一个workshop，吸引了来自全世界的38个队伍参加（CMU，中科院，法国科学院，香港理工，华中科技大学，国防科大，美国海军研究院，牛津大学，中国科技大学，浙江大学等），提交了38个新的算法参加了比赛，加上组委会自行提交的13个算法，总共对比分析了51个跟踪器在VOT2017 数据集上的表现。lQo鹿先生侃娱乐

在公开的38个队伍中，大连理工大学的卢湖川教授队伍夺得第一名。由北京邮电大学董远教授指导，北京飞搜科技&北京邮电大学代表队何智群、樊应若、庄骏飞、白洪亮提交的结果（CFWCR）获得VOT 2017竞赛公开的60个评测序列中第二名。lQo鹿先生侃娱乐

VOT 竞赛，检验当前单目标追踪最高标准 lQo鹿先生侃娱乐

VOT 2017与VOT 2016相比，VOT 2016中某些序列已经被多数tracker准确跟踪，所以在VOT 2017中，将VOT 2016的10个评测效果差图像序列替换如图1，并且保证总体的序列属性分布不变。与此同时，VOT2017相对于VOT2016对所有序列的还对所有序列的ground truth进行了重新标定，精确到像素级别，然后重新拟合矩形框。lQo鹿先生侃娱乐

lQo鹿先生侃娱乐

图1 vot2017标注变化图lQo鹿先生侃娱乐

VOT2017使用EAO（Expected Average Overlap）、Accuracy、Robustness三个主要指标对跟踪结果进行评估，lQo鹿先生侃娱乐

平均重叠期望（EAO）是对每个跟踪器在一个短时图像序列上的非重置重叠的期望值，是VOT评估跟踪算法精度的最重要指标。lQo鹿先生侃娱乐

准确率（Accuracy）是指跟踪器在单个测试序列下的平均重叠率（两矩形框的相交部分面积除以两矩形框的相并部分的面积）。lQo鹿先生侃娱乐

鲁棒性（Robustness）是指单个测试序列下的跟踪器失败次数，当重叠率为0时即可判定为失败。lQo鹿先生侃娱乐

平均重叠期望（EAO）是对每个跟踪器在一个短时图像序列上的非重置重叠的期望值，是VOT评估跟踪算法精度的最重要指标。lQo鹿先生侃娱乐

准确率（Accuracy）是指跟踪器在单个测试序列下的平均重叠率（两矩形框的相交部分面积除以两矩形框的相并部分的面积）。lQo鹿先生侃娱乐

鲁棒性（Robustness）是指单个测试序列下的跟踪器失败次数，当重叠率为0时即可判定为失败。lQo鹿先生侃娱乐

今年的VOT结果如下：lQo鹿先生侃娱乐

lQo鹿先生侃娱乐

图2 VOT2017结果图lQo鹿先生侃娱乐

VOT 2017结果显示，目前跟踪算法的主流方法主要分为三种，一是传统的相关滤波方法，二是基于卷积神经网络方法，三是深度卷积特征和传统的协同滤波相结合的方法。lQo鹿先生侃娱乐

其中，使用深度卷积特征和协同滤波结合的方法效果最好。例如今年VOT第一名，大连理工大学卢老师的LSART，他们提出的追踪器以一种新的方式结合了CNN和相关滤波，通过设计算法让CNN专注于特定区域的回归，相关滤波专注于全局的回归，在最后对回归的结果进行组合，以互补的方式得到物体的精确定位。lQo鹿先生侃娱乐

今年VOT的51个tracker中，深度特征和相关滤波结合的方法共9种，采用如VGG网络提取特征再输入到相关滤波框架内，以非端到端线上更新滤波参数，达到准确追踪的效果。这9种深度特征和相关滤波结合的方法在VOT2017种表现均较为出色，包揽了前四名。lQo鹿先生侃娱乐

VOT 2017视觉跟踪第二名技术：单卷积特征的相关滤波解决方案 lQo鹿先生侃娱乐

北京飞搜科技&北京邮电大学代表队提交的结果（CFWCR）获得VOT 2017竞赛公开的60个评测序列中第二名。lQo鹿先生侃娱乐

我们的方法基于业界流行的相关滤波的框架。我们使用了单CNN特征的多尺度追踪方案。现有很多追踪器融合了CNN特征和传统的机器学习特征，如hog特征，CN颜色特征等。在我们的实验中，我们发现CNN的浅层特征具有物体轮廓的信息，高层的深度特征具有物体的语义信息，将CNN的浅层和高层特征进行融合，能使追踪器具有很好的性能。lQo鹿先生侃娱乐

lQo鹿先生侃娱乐

图3 CFWCR追踪效果对比图lQo鹿先生侃娱乐

使用相关滤波框架的一大困难是具有很多的超参数，这和目前主流的端到端深度学习训练框架有很大的不同。我们发现用PCA对特征进行压缩，能使得追踪器在追踪速度上有很大的提高，但是性能会略有下降。因此，我们在评测上没有使用PCA，而在实用的追踪系统中用PCA能更好地均衡速度和精度。lQo鹿先生侃娱乐

下面是我们的追踪器在不同的序列长度下的表现曲线。可以看到，我们的算法在短视频序列的表现明显优于其他主流的算法。lQo鹿先生侃娱乐

lQo鹿先生侃娱乐

图4 CFWCR重叠率性能图lQo鹿先生侃娱乐

视觉跟踪未来展望：充分利用CNN lQo鹿先生侃娱乐

连续两年的VOT比赛中，基于相关滤波和CNN结合的追踪器表现突出，在性能指标上遥遥领先于其他算法。然而，非端到端的训练框架拥有很多的超参数，线上更新的方式也使得在实际算法部署的过程中，目前性能最优的一些追踪器难以满足实时性的要求。lQo鹿先生侃娱乐

视觉追踪方向和物体检测、物体分割方向不同的一点，在于CNN并没有完全发挥它的强大作用。未来的视觉追踪方向应该会更加关注实时性和训练的便捷性，端到端训练的追踪器会更多涌现，让CNN能够完全在视觉追踪领域发挥功效。我们也将继续在视觉跟踪领域深入研究，希望能给学术界和工业界做一些小小的贡献！lQo鹿先生侃娱乐

免责申明:本站所有内容均来自网络,我们对文中观点保持中立,对所包含内容的准确性,可靠性或者完整性不提供任何明示或暗示的保证,请仅作参考。若有侵权,请联系删除。lQo鹿先生侃娱乐

文章来源：新智元lQo鹿先生侃娱乐

1.《【视觉目标跟踪最高峰】VOT Challenge 2017 亚军北邮团队技术分享》援引自互联网，旨在传递更多网络信息知识，仅代表作者本人观点，与本网站无关，侵删请联系页脚下方联系方式。

2.《【视觉目标跟踪最高峰】VOT Challenge 2017 亚军北邮团队技术分享》仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址，https://www.lu-xu.com/fangchan/13068.html

【视觉目标跟踪最高峰】VOT Challenge 2017 亚军北邮团队技术分享

买房时，如果被“茶水费”了你会怎么做？

芥川龙之介：鼻子