依图夺得“大规模复杂场景人体视频解析”挑战赛行为识别冠军

行为识别是指以人为基础单位,只分析人的行为,关注单人的动作以及多人的动作。这项技术正在智能城市、安全生产、智能商业、智慧娱乐等社会生产生活的方方面面起到作用,比如实时检测工人是否遵循操作流程生产作业以防暴力分拣、针对短视频中人的行为进行摘要理解从而自动为用户推荐视频。

【安防在线 www.anfang.cn】近日,在由全球多媒体领域顶级学会ACM MM主办的“大规模复杂场景人体视频解析”挑战赛中,依图算法夺得第一,评价指标wf-mAP@avg达0.26,将以往学术界中的基准算法提升了近3倍,以绝对优势夺得“行为识别”赛道冠军。

行为识别是指以人为基础单位,只分析人的行为,关注单人的动作以及多人的动作。这项技术正在智能城市、安全生产、智能商业、智慧娱乐等社会生产生活的方方面面起到作用,比如实时检测工人是否遵循操作流程生产作业以防暴力分拣、针对短视频中人的行为进行摘要理解从而自动为用户推荐视频。

学术界以往常用f-mAP@avg来作为行为识别的评价指标,此次竞赛采用的评价指标wf-mAP@avg更注重对难度较大的拥挤场景的考察和少见动作的识别,同时对于人体框的定位精确性要求也更高。

依图夺得“大规模复杂场景人体视频解析”挑战赛行为识别冠军

由于挑战赛是首次举办,参赛团队在赛前无法获取识别的类别、数据集的大小和识别的具体需求。在不到两个月里,依图将算法与场景进行深度结合,从视频中自动提取到了准确丰富的场景信息,并借助多年来的算法积淀和对行业场景的理解等“先验知识”,对特定的14类任务进行了深度算法优化。

在此基础上,依图团队在仅使用单模型的情况下,取得了优于其他团队使用复杂多模型融合策略取得的成绩。同时,这也意味着依图仍可以进一步通过融合多个模型提升算法性能。

目前,依图行为识别算法的性能仍在持续迭代,实际运用该技术落地实战的项目难度已远超比赛的数据集。未来,依托于高性能自研AI芯片,依图将加速AI技术落地、解锁更多城市生产生活场景。

关于 ACM MM Grand Challenge

ACM是全球最大的计算机领域专业性学术组织,其评选的图灵奖(A.M.Turing Award)被公认为世界计算机领域的诺贝尔奖。而ACM MM是全球多媒体领域的顶级会议,属中国计算机学会(CCF)指定的A类国际会议。

在此次比赛中,包括亚马逊、腾讯、大华科技、中山大学等上百支队伍参与了超过56000个复杂事件下的人体行为解析。该比赛也是行为识别方向最接近真实场景的大规模挑战赛。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 基于云计算的视频实战应用平台的建设方案和应用

    常州市平安城市视频监控技术已经从联网整合阶段。发展到视频实战深度应用阶段。常州市公安局根据本地的视频实战应用需求,建设了基于云计算的视频实战应用平台。

    2024年1月15日
  • 公安图侦手段分析及应用

    视频建设的不断建设和投入使用,视频图像的分辨率也随之大大提高,有利于扩展更多的监控分析功能。通过引进先进的视频技术,改变传统视频监控的被动性和人为性,减少各类因素造成的监控问题,增强治安监控系统的智能性、可用性,降低监控员的工作强度,提高工作效率。

    2024年4月4日
  • 安徽四创雪亮工程解决方案

    以构建立体化公共综合防控体系、拓展公共视频的社会共享服务为目标,基于相关政策和技术规范,整合各类视频图像信息资源,建立跨部门、跨区域的视频服务,拓展政府、民众对视频图像信息的综合应用,形成公共安全信息化支撑的服务体系。

    2024年1月14日
  • 视频云服务+大数据平台设计方案

    视频云+大数据平台包括:视频图像信息数据库(一库)、应用支撑服务平台(一平台)、视频图像解析系统和视频云+应用系统组成。

    2024年1月17日 方案
  • 高新兴视频云解决方案

    视频监控是安防行业的首要技术手段,视频的直观性、客观性、实时性与信息量大是其最大的优势。

    2024年1月14日
  • 华为雪亮工程解决方案

    “雪亮工程”是守护人们安宁的“千里眼”,数年来为推进社会治理现代化和平安中国建设作出重大贡献,取得了阶段性成效。

    2024年1月14日