【安防在线 www.anfang.cn】近日,在由全球多媒体领域顶级学会ACM MM主办的“大规模复杂场景人体视频解析”挑战赛中,依图算法夺得第一,评价指标wf-mAP@avg达0.26,将以往学术界中的基准算法提升了近3倍,以绝对优势夺得“行为识别”赛道冠军。
行为识别是指以人为基础单位,只分析人的行为,关注单人的动作以及多人的动作。这项技术正在智能城市、安全生产、智能商业、智慧娱乐等社会生产生活的方方面面起到作用,比如实时检测工人是否遵循操作流程生产作业以防暴力分拣、针对短视频中人的行为进行摘要理解从而自动为用户推荐视频。
学术界以往常用f-mAP@avg来作为行为识别的评价指标,此次竞赛采用的评价指标wf-mAP@avg更注重对难度较大的拥挤场景的考察和少见动作的识别,同时对于人体框的定位精确性要求也更高。
由于挑战赛是首次举办,参赛团队在赛前无法获取识别的类别、数据集的大小和识别的具体需求。在不到两个月里,依图将算法与场景进行深度结合,从视频中自动提取到了准确丰富的场景信息,并借助多年来的算法积淀和对行业场景的理解等“先验知识”,对特定的14类任务进行了深度算法优化。
在此基础上,依图团队在仅使用单模型的情况下,取得了优于其他团队使用复杂多模型融合策略取得的成绩。同时,这也意味着依图仍可以进一步通过融合多个模型提升算法性能。
目前,依图行为识别算法的性能仍在持续迭代,实际运用该技术落地实战的项目难度已远超比赛的数据集。未来,依托于高性能自研AI芯片,依图将加速AI技术落地、解锁更多城市生产生活场景。
关于 ACM MM Grand Challenge
ACM是全球最大的计算机领域专业性学术组织,其评选的图灵奖(A.M.Turing Award)被公认为世界计算机领域的诺贝尔奖。而ACM MM是全球多媒体领域的顶级会议,属中国计算机学会(CCF)指定的A类国际会议。
在此次比赛中,包括亚马逊、腾讯、大华科技、中山大学等上百支队伍参与了超过56000个复杂事件下的人体行为解析。该比赛也是行为识别方向最接近真实场景的大规模挑战赛。
该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们。