依图夺得“大规模复杂场景人体视频解析”挑战赛行为识别冠军

小安 • 来源：依图科技 • 2024年4月9日下午1:33 • 知识 • 阅读 66

【安防在线 www.anfang.cn】近日，在由全球多媒体领域顶级学会ACM MM主办的“大规模复杂场景人体视频解析”挑战赛中，依图算法夺得第一，评价指标wf-mAP@avg达0.26，将以往学术界中的基准算法提升了近3倍，以绝对优势夺得“行为识别”赛道冠军。

行为识别是指以人为基础单位，只分析人的行为，关注单人的动作以及多人的动作。这项技术正在智能城市、安全生产、智能商业、智慧娱乐等社会生产生活的方方面面起到作用，比如实时检测工人是否遵循操作流程生产作业以防暴力分拣、针对短视频中人的行为进行摘要理解从而自动为用户推荐视频。

学术界以往常用f-mAP@avg来作为行为识别的评价指标，此次竞赛采用的评价指标wf-mAP@avg更注重对难度较大的拥挤场景的考察和少见动作的识别，同时对于人体框的定位精确性要求也更高。

由于挑战赛是首次举办，参赛团队在赛前无法获取识别的类别、数据集的大小和识别的具体需求。在不到两个月里，依图将算法与场景进行深度结合，从视频中自动提取到了准确丰富的场景信息，并借助多年来的算法积淀和对行业场景的理解等“先验知识”，对特定的14类任务进行了深度算法优化。

在此基础上，依图团队在仅使用单模型的情况下，取得了优于其他团队使用复杂多模型融合策略取得的成绩。同时，这也意味着依图仍可以进一步通过融合多个模型提升算法性能。

目前，依图行为识别算法的性能仍在持续迭代，实际运用该技术落地实战的项目难度已远超比赛的数据集。未来，依托于高性能自研AI芯片，依图将加速AI技术落地、解锁更多城市生产生活场景。

关于 ACM MM Grand Challenge

ACM是全球最大的计算机领域专业性学术组织，其评选的图灵奖（A.M.Turing Award）被公认为世界计算机领域的诺贝尔奖。而ACM MM是全球多媒体领域的顶级会议，属中国计算机学会（CCF）指定的A类国际会议。

在此次比赛中，包括亚马逊、腾讯、大华科技、中山大学等上百支队伍参与了超过56000个复杂事件下的人体行为解析。该比赛也是行为识别方向最接近真实场景的大规模挑战赛。

该文观点仅代表作者，本站仅提供信息存储空间服务，转载请注明出处。若需了解详细的安防行业方案，或有其它建议反馈，欢迎联系我们。