Meta发布史上首个图像分割基础模型

SAM是第一个致力于图像分割的基础模型。据Meta介绍,SAM已经学会了关于物体的一般概念,并且它可以为任何图像或视频中的任何物体生成掩码,甚至包括在训练过程中没有遇到过的物体和图像类型。SAM足够通用,可以涵盖广泛的用例,并且可以在新的图像领域上即开即用,无需额外的训练。

4月6日,Meta推出了一款Segment Anything Model (SAM)。据介绍,该模型能够根据文本指令等方式实现图像分割,而且万物皆可识别和“一键抠图”。SAM是第一个致力于图像分割的基础模型。据Meta介绍,SAM已经学会了关于物体的一般概念,并且它可以为任何图像或视频中的任何物体生成掩码,甚至包括在训练过程中没有遇到过的物体和图像类型。SAM足够通用,可以涵盖广泛的用例,并且可以在新的图像领域上即开即用,无需额外的训练。

在此之前,分割作为计算机视觉的核心任务,已经得到广泛应用。但是,为特定任务创建准确的分割模型通常需要技术专家进行高度专业化的工作,此外,该项任务还需要大量的领域标注数据,种种因素限制了图像分割的进一步发展。

以前,解决分割问题大致有两种方法。第一种是交互式分割,该方法允许分割任何类别的对象,但需要一个人通过迭代细化掩码来指导该方法。第二种,自动分割,允许分割提前定义的特定对象类别(例如,猫或椅子),但需要大量的手动注释对象来训练(例如,数千甚至数万个分割猫的例子)。这两种方法都没有提供通用的、全自动的分割方法。

Meta发布史上首个图像分割基础模型

SAM是这两类方法的结合。它是一个单一的模型,可以轻松地执行交互式分割和自动分割。该模型的可提示界面允许以灵活的方式使用它,只需为模型设计正确的提示(点击、框、文本等),就可以完成范围广泛的分割任务。

此外,SAM在包含超过10亿个掩码(作为该项目的一部分收集)的多样化、高质量数据集上进行训练,这使其能够泛化到新类型的对象和图像,超出其在训练期间观察到的内容。这种概括能力意味着,从业者将不再需要收集他们自己的细分数据并为他们的场景微调模型。

总而言之,这些功能使SAM能够泛化到新任务和新领域。这种灵活性在图像分割领域尚属首创。最强大的是,Meta实现了一个完全不同的CV范式,你可以在一个统一框架prompt encoder内,指定一个点、一个边界框、一句话,直接一键分割出物体。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 大数据技术成为智慧城市的动力发展引擎

    “智慧城市”的建设核心有两点:一是所需信息的获取和传递,二是所得信息的处理与应用。如果说信息的获取和传递造就了“数字城市”,那么通过信息的分析处理与应用从而获得支撑和保障城市智慧化运营的决策信息,则是从“数字城市”到“智慧城市”质变的关键所在。大数据技术可以应用在“智慧城市”运行的各个环节和领域,从宏观到微观,大到城市规划,小到交通调度,都发挥着提升决策能力的作用。

    2024年7月12日
  • 纽约警方拟使用无人机及枪声探测器遏制犯罪

    据《纽约今日新闻》报道纽约警察局长布拉顿20日表示,纽约警方正在考虑拨巨款购置无人机巡逻来防止犯罪。与此同时,纽约警队今年已经拨款50万美金,将其用于枪声探测器项目。米勒表示,这些探测器可以和监控摄像头联合,以帮助纽约警方迅速抓捕罪犯。

    2024年4月25日
  • 青岛建云数据中心 打造智慧城市发展新引擎

    作为岛城主导运营商,中国移动发挥自身技术、服务、业务、客户领先优势,在优质4G网络基础上,进一步围绕“互联网+”战略,推进云计算、大数据应用、IDC等服务,为岛城信息化发展提供全新引擎。

    2024年2月7日
  • 雷曼光电上半年海外业务发力,营收、归母净利润均创同期历史新高

    雷曼光电上半年海外业务实现营业收入4.49亿元,较上年同期增长40.61%。其中国际显示业务实现营收2.53亿元,同比增长53.64%,国际照明业务实营收入1.95亿元,同比增长26%。

    2024年2月15日
  • 宁夏构建全环节全链条常态化的校园安全体系

    方案要求坚持生命至上、坚持问题导向、坚持防范在先、坚持综合治理,构建系统、科学、智慧、高效的校园安全防范体系,确保全区校园不发生重大安全事故,努力把校园建设成为安全稳定的模范之地。

    2023年10月1日
  • 杭州市区运河泥浆废土装卸实现视频监管

    日前,杭州市区运河第一家泥浆废土临时设泊点视频监控正式接入港航内网,从此可实现24小时在线监管,标志着泥浆废土临时设泊管理新措施全面启动。

    2024年7月27日