佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

近日,在上海人工智能实验室发布的多模态大模型榜单 MMBench 中,来自佳都科技中央研究院的TransCore-M超过LLaVA、mPLUG-Owl2、Qwen-VL-Chat 等 20 余个来自世界一流大学和业界大厂的多模态大模型,分别在 4 个榜单中都高居第二。

近日,在上海人工智能实验室发布的多模态大模型榜单 MMBench 中,来自佳都科技中央研究院的TransCore-M超过LLaVA、mPLUG-Owl2、Qwen-VL-Chat 等 20 余个来自世界一流大学和业界大厂的多模态大模型,分别在 4 个榜单中都高居第二。目前,TransCore-M 的模型和推理 demo 已在 huggingface 开源,并开放体验。

佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

△MMBench榜单(其一),MMBench是上海AI lab和南洋理工大学联合推出的

基于ChatGPT的全方位多模能力评测体系。

模型架构与训练

佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

TransCore-M 采用预训练和指令微调两种训练策略,来提升模型的多模态能力:

l预训练阶段:冻结视觉模块(Visual Encoder)和语言模型(PCITransGPT),使用大量图文数据将图像和文本知识进行对齐;

l指令微调阶段:构造多样性的文本和多模态联合数据,保持视觉模块冻结,将视觉对齐模块和语言模型进行全参微调,使得模型能够具备更丰富的多模态理解能力。

交通行业能力

技术上,佳都科技布局视觉模型多年,自 2015 年开始加强在人脸识别、视频大数据领域的技术投入,2017 年成立中央研究院,开展数据和智能中台建设,2019年推出城轨智慧运营系统华佳 Mos,2020 年开始研发基于数字孪生技术的 AR(增强现实)引擎,将多维信息和 3D 虚拟界面融合。

应用场景方面,佳都长期深耕智慧大交通主赛道,积累了深厚的智慧交通行业项目经验和数据优势。一类是直接与视觉感知有关,主要是前端的采集智能设备,另一类是交通场景,包括车站客流分析、行车图优化、应急调度指挥、智能运维、智能安检,信号灯调优、交通拥堵分析、综合枢纽与公交客流分析导向等。

通过将以往的经验和数据沉淀为行业资产,多模态大模型深度融合了丰富的领域知识,结合高质量的专业语料库,确保模型具有卓越的理解和判断能力。

点击huggingface 主页中的 demo 链接后,用户仅需上传图片,即可与TransCore-M 进行对话。

示例1:交通视觉描述

佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

示例2:交通违规检测

佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

示例3:路况检测

佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

示例4:异常事件检测

佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

示例5:异常事件检测

佳都科技中央研究院多模态大模型TransCore-M 发布!MMBench高居第二

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 2022年中国人脸识别行业产业链上中下游市场及企业剖析

    近年来,随着人工智能、计算机视觉、大数据、云计算、芯片等技术的迅速发展,人脸识别技术取得了长足的进步并且在众多场景中得以成功应用,随着未来技术条件的进一步成熟以及智能化时代的全面到来,人脸识别的应用将进一步拓展和深化。

    2024年2月16日 资讯
  • 平安祁连:古有千里眼 今有移动慧眼

    如今走进祁连山下东川镇寺尔沟村,映入眼帘的是数十个布放在村内要道的“眼睛”,被形象地称为“移动慧眼”,通过这个“慧眼”辨人识物,为村委和村民提供着7×24小时的安全监控服务。

    2024年2月12日
  • 用人工智能为医联体赋能 商汤科技打造未来医院运营方案

    商汤科技副总裁、研究院副院长张少霆介绍,商汤的智慧诊疗平台目前重点关注中国高发病,比如老龄化相关疾病、呼吸道疾病和心脑血管疾病,包括200多项专利和10余项软件著作权。

    2024年1月28日
  • 天津市将致力于打造物联网群

    记者从天津市西青区获悉,天津学府物联网产业园目前已初具规模,该项目将利用学府产业园区技术优势和产业资源,打造云计算、大数据、移动互联网、移动通信传输多个领域的物联网产业集群。

    2024年2月7日
  • 由浅入深:综观门禁对讲系统布线技术

    门禁系统是进出管理系统的一个子系统,通常它裼盟⒖ā⒚苈牖蛉颂迳物特徵识别等技术,在管理软件的控制下,对人员或车辆出入口进行管理,让取得认可进出的人车自由通行,而对那些不该出入的人则加以禁止及干涉。

    2024年7月27日
  • 河北45.9万人高考所有考场全程视频监控

    2012年,按照国家教育考试标准化考点建设要求,河北省所有考场都将安装考场视频及网络监控系统、作弊防控系统并全程录像。每个考点都将设置监控中心,每名监控员巡查不超过9个考场。

    2024年9月15日