依图夺得“大规模复杂场景人体视频解析”挑战赛行为识别冠军

行为识别是指以人为基础单位,只分析人的行为,关注单人的动作以及多人的动作。这项技术正在智能城市、安全生产、智能商业、智慧娱乐等社会生产生活的方方面面起到作用,比如实时检测工人是否遵循操作流程生产作业以防暴力分拣、针对短视频中人的行为进行摘要理解从而自动为用户推荐视频。

【安防在线 www.anfang.cn】近日,在由全球多媒体领域顶级学会ACM MM主办的“大规模复杂场景人体视频解析”挑战赛中,依图算法夺得第一,评价指标wf-mAP@avg达0.26,将以往学术界中的基准算法提升了近3倍,以绝对优势夺得“行为识别”赛道冠军。

行为识别是指以人为基础单位,只分析人的行为,关注单人的动作以及多人的动作。这项技术正在智能城市、安全生产、智能商业、智慧娱乐等社会生产生活的方方面面起到作用,比如实时检测工人是否遵循操作流程生产作业以防暴力分拣、针对短视频中人的行为进行摘要理解从而自动为用户推荐视频。

学术界以往常用f-mAP@avg来作为行为识别的评价指标,此次竞赛采用的评价指标wf-mAP@avg更注重对难度较大的拥挤场景的考察和少见动作的识别,同时对于人体框的定位精确性要求也更高。

依图夺得“大规模复杂场景人体视频解析”挑战赛行为识别冠军

由于挑战赛是首次举办,参赛团队在赛前无法获取识别的类别、数据集的大小和识别的具体需求。在不到两个月里,依图将算法与场景进行深度结合,从视频中自动提取到了准确丰富的场景信息,并借助多年来的算法积淀和对行业场景的理解等“先验知识”,对特定的14类任务进行了深度算法优化。

在此基础上,依图团队在仅使用单模型的情况下,取得了优于其他团队使用复杂多模型融合策略取得的成绩。同时,这也意味着依图仍可以进一步通过融合多个模型提升算法性能。

目前,依图行为识别算法的性能仍在持续迭代,实际运用该技术落地实战的项目难度已远超比赛的数据集。未来,依托于高性能自研AI芯片,依图将加速AI技术落地、解锁更多城市生产生活场景。

关于 ACM MM Grand Challenge

ACM是全球最大的计算机领域专业性学术组织,其评选的图灵奖(A.M.Turing Award)被公认为世界计算机领域的诺贝尔奖。而ACM MM是全球多媒体领域的顶级会议,属中国计算机学会(CCF)指定的A类国际会议。

在此次比赛中,包括亚马逊、腾讯、大华科技、中山大学等上百支队伍参与了超过56000个复杂事件下的人体行为解析。该比赛也是行为识别方向最接近真实场景的大规模挑战赛。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 谷歌提供免费机器课程及学习资源 普及人工智能技术

    最新的项目则你瞄准那些拥有各种经验的人,既包括初学者,也包括专家。谷歌称:“该网站提供了各种方法来学习核心机器学习概念,开发和提炼你的机器学习技能,并用机器学习来解决现实问题。从寻找高级教程的深度学习专家到TensorFlow的材料,再到那些希望迈出人工智能第一步的‘好奇猫’,任何寻找谷歌机器学习专家提供的教育内容的人,都可以在这里找到自己想要的东西。”

    2024年7月27日
  • 创世科技亮相2019美国 ISC West 安防展

    ISCWest是业内公认的全美规模最大的安防展会,展会展商超过1000多家,客商数量达到30000人,展会面积超过25000平方。一直以来,业内人士都把美国西部国际安防产品博览会看作美国安防行业的晴雨表,ISCWest服务于所有安防产品分销渠道,并为新工艺、新技术、新产品方案的发布举办论坛。

    2024年4月13日 资讯
  • 湛江海滨船厂智慧安防系统项目中标公告

    一、项目编号:0747-2360SCCGD186(招标文件编号:0747-2360SCCGD186) 二、项目名称:智慧安防系统项目 三、中标(成交)信息 供应商名称:广州市高科通…

    2024年6月21日
  • IP监控的十大误解

    IP监控的十大误解

    2024年4月21日
  • 海康威视如何把视频合成(海康威视的视频怎么导出)

    海康威视如何把视频合成 海康威视是一家领先的视频监控解决方案提供商,其技术和产品在全球范围内广泛应用。视频合成是海康威视的一项重要技术,它可以将多个视频源合并成一个统一的视频输出。…

    2024年9月30日
  • 基于CMOS芯片的彩色图像采集处理系统设计与实现

    世界上最大的CCD传感器芯片供货商SONY已宣布到2025年将不再生产CCD传感器,完全专注于CMOS技术。本文介绍了一种基于CMOS芯片的彩色图像采集处理系统,CMOS芯片采用Aptina公司的MT9V034,处理器采用TI达芬奇芯片TMS320DM642,其内部运行有基于彩色信息的图像处理算法,CMOS采集的图像用于图像处理算法的输入。

    2024年9月15日 知识