“我虽然不懂什么叫大模型,但如果不需要用很高成本的话,我也想尝试用一下,现在生意真的太难做了。”一位做某摄像头品牌的渠道代理商告诉CPS中安网。
自ChatGPT这股春风吹到了中国,国内互联网公司巨头百度率先扛起大旗发布了国内大模型“文心一言”,中国大模型发展态势自此开始势不可挡。
从打造“中国版ChatGPT”,到如今的“私域大模型”“专用大模型”“产业大模型”“垂类模型”“类ChatGPT模型”等概念纷纷炒,中国大模型的推广从某种程度上已经开始出现了由通用大模型转入行业大模型的势头。
01.
企业为什么聚焦行业大模型?
为了让读者对目前行业大模型的布局有更直观的了解,CPS中安网大致统计了目前国内企业已“冒头”的行业大模型(不包括通用大模型),如下表:
“大模型的研发、迭代和运维都需要大量资源,不是每个行业都能迅速实现投入产出比的,所以比较适合由行业龙头与AI技术型公司进行联合,把双方合作能量发挥到最大,这也是行业龙头牵头做行业大模型的责任感和使命感。”主做边缘计算盒子的英码科技市场总监李甘来告诉中安网。
“每个企业或者行业到一定发展阶段都需要一个新东西来刺激市场,相信之后也肯定还会有更多企业推出自研大模型产品,行业大模型的战争已经拉开。”相关推出行业大模型的企业的多位员工向CPS中安网表达出相似观点。
对于行业大模型,现在还有很多人在观望中,很多人都对行业大模型能否实现大范围落地存在疑问,但对这个问题,从各企业的反馈上,目前还没有一个明确的答复,大部分企业表态仍需花费更多时间去进行市场教育。
而行业大模型为什么会受到众多企业的聚焦关注,CPS中安网总结了主要为以下两点:
基于开源进行微调
在今年3月份后,因GPT的API调用成本有所降低,叠加上国内众多大模型相关组件相继开源后,深耕行业且有条件的企业便能基于各类大模型的开源组件利用行业数据进行调优训练,生成自己的行业大模型。
这也是为什么现在行业大模型能够频繁推出的原因,因为研究门槛有所降低了,如果针对一个行业要完全独立自主研发出一款全新的大模型,投入产出比太低,企业很难承担,毕竟快速落地和盈利要摆在理想的前面,所以目前市面上大部分行业大模型选择的研发路径是“自研小模型➕部分开源组件➕行业场景数据调优”。
“Chat GPT是Open
AI用了数万块的GPU,金额超过10亿美金的数据中心建设出来的,现在的百模大战、千模大战,有多少企业有实力去做通用大模型?行业大模型事实上应该是各个领域都会去追寻的一个模式。”某业内人士坦言道。
通用大模型很难在行业场景得到最佳应用
从市场角度是门槛降低,那从模型本身来说,行业大模型的出现则是为了弥补通用大模型无法最优化适配到千行百业中的痛点。
在实际的项目落地上,行业大模型相较通用大模型而言,因为其不需要太强的通用能力,所以对数据量要求相对较低。比如前期经过标注后,在训练过程中,通用大模型需要100张各式各样的图片,而行业大模型训练大约只需要相关应用场景的8张图片左右即可,理论上这大大降低了对数据样本数量的要求。
而因为行业大模型是经过行业数据的专注、反复训练,所以生成的内容理论上也会更加精准和稳定。
02.
行业大模型和算法商城的区别
大模型的兴起源于Open
AI,解决的是NLP这个领域,最主要的技术就是Transformer,而以前段时间CPS中安网在北京安博会上看到宇视、360智慧生活、联汇等企业展示的大模型进展来看,目前大模型已经慢慢从NLP领域泛化到了CV领域。
在与一些摄像头经销渠道商的交流过程中,也有一部分人士发出了一些疑惑:为什么要用行业大模型?有一些检测场景直接用算法商城里面的算法不就行了吗?
其实我们可以把算法商城看作是小模型,小模型相对大模型而言,其特点是研发投入较低,只针对特定场景,也就是我们所说的定制化程度会更高,但是算法生产的主动权并不在用户手里。
举个简单的例子,算法商城好似一张菜单,吃饭的人只能在这张菜单里点菜,因为那些都是厨师在不亏成本的情况下可以做出成品的限定菜式,每家饭馆的菜单都有同有异,但如果想吃不一样的原材料,只能多点菜,而且能吃到什么还得看饭馆老板。
而大模型和算法商城不一样的点在于,大模型可以做到泛化和推理,因为大模型具备深度学习的能力。
比如大模型可以不用特意训练它知道什么是斑马,只要它前期知道线条,颜色、马等最基本的信息,之后告诉它黑白相间的马,它就能经过泛化推理后给你找出各种斑马的图片,这完全省去了因为条纹大小,马的大小,背景的不同从而产生的差异而需要第二次重新生成算法的成本。
要是遇到像宇视这类对合作伙伴开放大模型训练平台的企业,用户还可以具体针对自己的业务场景需求训练、产出自己的算法。
“在之前的深度学习领域,算法的生产属于烟囱式,所以算法种类的拓展遇到的困难便是投入产出比与客户需求之间的矛盾,而以现在的CV大模型来说,算法种类会更容易扩充,理论上有一个方形的识别,其便可以在方形的识别上,训练出盒子的识别,汽车的识别等各种各样的识别。”宇视产品中心副总裁汤利波说。
当然了,前面讲的都只是理想状态下的举例子,具体的CV领域行业大模型的具体项目落地情况暂时还未有企业进行过多披露。
“每个好的想法都需要在落地中检验,目前阶段显然还没到真正检验各个行业大模型含金量的时候,但行业大模型最终要实现真正的工程化,都需要解决一个核心难题就是怎么真正懂得每个行业的Know-How。”
专做算法自动化生产的共达地高级市场总监李苏南向CPS中安网谈道。
03.
行业大模型还有坎要迈?
不可置否,当行业大模型具备了信息压缩、知识网络构建、逻辑判断与推理等良好能力之后,此时,产业受益之处就体现出来了,中小企业或将都有机会用上行业大模型,但取经路上总要经历九九八十一难,行业大模型目前还需迈过这些坎:
各行业大模型之间能否适配
从上述统计表中可以看出,目前行业大模型应用主要集中在金融、文旅、媒体、医疗、教育等领域,多个大模型之间的应用方向有所重合,这也不得不产生一个疑问,同个行业应用中,行业大模型之间究竟会不会存在排他性?这对用户来说是否又是一个单选题?下面借用文心一言的回答说明一下为什么会产生这个疑问。
落地后含金量的检验
众所周知,好的行业大模型的投入比小模型来说要求更高,所以其能否快速工程化是摆在所有研发企业面前的难题,就目前来看,较快速的落地方式还是以新项目或是与之前存量的市场有直接挂钩的增益点,为合作伙伴开辟新机会。
但是否每个推出行业大模型的企业都具备足够多的项目或者存量市场去落地?是短期蹭流量还是扎实稳打?这个尚不敢下定论,但可以肯定的是,大模型和产业的结合仍处在早期阶段。
要想真正深入行业,还是得对行业know-how进行深入了解,否则实际应用到特定场景、特定行业时还是可能无法达到性能最优,就部分首批体验大模型的用户合作意愿反馈来看,这些用户还是希望能通过行业大模型来提升数据标注进度,降低之前多个模型迁移带来的成本,甚至进一步开拓存量市场的新的商业价值。
虽然落地含金量还需要长时间去检验,但也不得不说,短期效应来看,目前大模型确实掀起了一股“淘金热”。
比如2021年12月创立的大模型赛道创业公司MiniMax,又完成了新一轮2.5亿美元融资;成立于2021年,专注于大模型的研究和应用的西湖心辰也宣布完成数百万美元的Pre-A轮融资;美团联合创始人王慧文的AI创业公司光年之外,已在近期完成了新一轮2.3亿美元融资;多模态大模型初创公司“智子引擎”完成了千万元天使轮融资……
就这股大模型热潮下,百度创始人、董事长兼CEO李彦宏也曾公开表示对行业大模型的看好:未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型。大模型会深度融合到实体经济当中去,赋能千行百业,助力中国经济开创下一个黄金30年。
鉴于最近大模型属实太热门,CPS中安网也将顺势开辟大模型专题,之后将紧跟相关企业的行业大模型进展,主动联系产业上下游,聚焦市场动态,大家拭目以待,欢迎行业人士添加作者微信lssw126888进行交流。
该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们。