再传喜讯!百度大脑实现多目标追踪突破 跃居MOT榜单第一

?

5月7日,在国际权威多目标跟踪挑战赛(MOT)的MOT16榜单上,百度的视觉技术团队超越了平安科技,尚唐科技和上海交通大学等众多强大的团队获取名单。世界上第一个好结果。 MOTA指标显着改善,超过1.8分的第二名; MOTA是错误检测,漏检和ID交换三个指标的综合平均值。

在2019年上半年,百度的视觉技术团队在2019年的CVPR,ICME2019 Facepoint和Widerface中获得了第一名。 MOT竞赛是百度视觉技术团队赢得冠军的又一次。它正在实践“领先和实用的AI视觉技术”,是视频新领域的又一次突破。

img_pic_1557393716_0.png

(MOT16评测集排名,百度排名第一)

多目标跟踪挑战是国际多目标跟踪最权威的评估平台。它由阿德莱德大学,苏黎世联邦理工学院和达姆施塔特技术大学共同建立。这是世界主要人工智能研究机构的必需品。

该平台测量复杂场景中多线物体运动的性能,以评估同时检测和跟踪的性能。目前,它主要包括三个评估集:MOT15,MOT16和MOT17。 MOT16允许团队定制探测器,评估目标探测,特征提取和跟踪等多模块的综合效果,这更具挑战性和实用性。

这一次,百度的视觉技术团队在MOT16评测中获得了桂冠,超越了平安科技,上唐科技,海康威视,腾讯Youtu,NEC北美研究院,上海交通大学,斯坦福大学等的强大实力。 - 知名大学和公司团队,技术实力不容小觑。

百度的视觉技术团队在相关算法方面进行了许多创新和改进,例如检测,重新识别和多目标跟踪。检测部分基于百度自主研发的PaddlePaddle深度学习平台,选择功能更强大的分类基础网络,采用多尺度特征提取,改进对象模板,提高小目标的召回能力,并采用级联网络结构目标框架更精细回归;行人识别,使用基于多个实例的自行开发的方法,可以进一步探索“困难区域”中样本的细粒度特征,从而提高特征空间中类似样本的可区分性;跟踪部分,使用基于行人特征重新识别序列特征相似度模型,进行目标轨迹匹配,并利用时空特征减少密集多目标跟踪的轨迹交换问题。

从实际角度来看,多目标跟踪是视频理解和分析领域的核心技术之一。近年来,随着人工智能技术的不断落地,多目标跟踪在许多重要的应用场景(尤其是AI到B场景)中发挥着越来越重要的作用,如城市安全,客流分析,智能零售和直播。

基于对多目标跟踪技术的重视,百度视觉技术团队在此方向上积累了数百万级的检测,重新识别和跟踪训练数据;许多相关的开放服务,如人体检测,人体跟踪,人体识别,静态/动态流量统计等,已经形成了完整的B侧人体分析服务矩阵。内部支持百度智能云,自动驾驶等服务;并通过百度大脑AI开放平台向外界开放,服务于各行各业。未来,百度的视觉技术团队将继续推动多目标跟踪领域的创新工作,努力实现更实际的应用场景。

视觉技术是百度的核心技术能力之一,其领先的国际技术优势为开发人员带来了更多创新机会。 MOT评估的胜利是百度大脑技术实力的有力证明,它也为百度的人工智能巨树增添了巨大的成果。据了解,百度视觉技术团队不仅在许多国际比赛中获得了第一名,而且还发表了关于计算机视觉顶级会议的文章,如CVPR,ICCV,ECCV和AAAI。

百度脑是百度人工智能技术积累和商业实践的集合。除了引领国际的视觉技术外,它还经常用于深度学习领域。不久前,百度深度学习平台PaddlePaddle首次发布了全景图,并展示了业界领先且功能齐全的开源深度学习平台,集成了深度学习核心框架,工具组件和服务平台。大数据,大模型和大计算能力是深度学习发展的重要因素,计算能力的重要性是不言而喻的。基于此,PaddlePaddle的一站式深度学习开发平台AI Studio还发送了1亿元的免费计算能力,为普通开发者打破了电源。

未来,百度的大脑将继续秉承AI Pratt&Whitney的价值理念,在不断完善行业实践的同时,超越自我攀登的高峰,展望未来,为开发者建立完美的AI生态环境,用技术改变生活。服务社会,贡献自己的人工智能,促进人类文明和发展。