国家新一代人工智能的重要发展方向是决策智能

近日,中国科学院自动化研究所(以下简称自动化所)宣布开放“庙算・智胜”战术兵棋即时策略人机对抗平台,旨在进一步推动人机对抗智能技术研究。据了解,该平台曾用于“先知・兵圣”智能博弈对抗系列赛事,具有平台开放、在线对抗、技术共享等特点。

【安防在线 www.anfang.cn】近日,中国科学院自动化研究所(以下简称自动化所)宣布开放“庙算・智胜”战术兵棋即时策略人机对抗平台,旨在进一步推动人机对抗智能技术研究。据了解,该平台曾用于“先知・兵圣”智能博弈对抗系列赛事,具有平台开放、在线对抗、技术共享等特点。

人机对抗是国际公认的探索决策智能重要途径之一。作为国家新一代人工智能的重要发展方向,决策智能的研究和发展方兴未艾。同时,由于决策智能涉及多个学科的交叉,相关的探索尚须各方共同努力。

涉及多个学科

国家新一代人工智能的重要发展方向是决策智能

到底该如何定义决策智能?在近日举办的“首届智能决策论坛”上,自动化所所长徐波认为,由于我们对人类智能的机理仍缺乏系统了解,对人工智能做内涵式、学科式的定义仍然困难重重。但他介绍说,决策智能强调智能“产生于与其所处环境的交互”,且智能应具备“对不确定性环境的探索和发现”的能力。

他解释,决策智能要求智能体能在不确定的环境中做出合适的行动、选择和决定。而这里的“环境”,指的是人们试图用人工智能更好地了解、探索、建模和驾驭的物理世界、人类社会等系统。

有别于感知智能,决策智能主要基于对不确定环境的探索,因此需要获取环境信息和自身的状态,从而进行自主决策,使由环境反馈的收益最大化。这一反馈形成的系统闭环,将使人工智能拥有更完整的表现形式。

自动化所是国内率先开展人工智能与脑科学交叉研究、建立国内第一个人工智能学院的科研单位。目前,该所正将自主进化智能作为重点投入、发展和突破的方向,已组织20余个团队开展决策智能基础理论、算法、环境、评价、应用等研究。

在上述论坛上,欧洲科学院外籍院士、北京大学前沿计算研究中心教授邓小铁,清华大学交叉信息科学院助理教授张崇洁,伦敦大学学院计算机系教授汪军等学者也对决策智能的内涵进行了探讨。学者们指出,决策智能带有强烈的“行为主义”流派的色彩,而同时又能吸收“符号主义”和“连接主义”的精华。这种特点,使得决策智能涉及计算机、控制、数学、认知心理学、神经科学等诸多学科。

“目前基于强化学习等方法的决策智能,主要还是在学习‘状态’到‘动作’的映射,与可解释的、因果关系的、可以互动的决策还有很远距离。”邓小铁表示。

与博弈论相互影响

在探索决策智能的诸多路径之中,多智能体系统(以下简称多智能体)是国际上人工智能技术的前沿学科。人们寄希望于彼此通信和协调的多智能体采取协调行动,以解决大型、复杂的现实问题。但目前,很多基于强化学习的多智能体研究方法并不够成熟。

“博弈论是刻画和分析多智能体相互之间竞争最好的理论框架。”邓小铁认为,博弈论在多智能体系统研究中将扮演理论基础的角色,同时人工智能的发展也给博弈论学科带来了深远的影响。

“从博弈论已有的理论中借鉴想法指导设计强化学习方法,常常能够获得较优的结果;而反之,如果没有相应的理论作为指导,研究者们容易出现‘脚踩西瓜皮,滑到哪儿算哪儿’的尴尬局面。”邓小铁说,多智能体系统若想有更好的发展,需要有相应的理论基础,而博弈论正扮演这个角色。

此外,汪军认为,机器学习系统本质上只是信息处理系统的一个子集,目前的机器学习与信息理论紧密结合,未来将有越来越多的信息学理论被应用到机器学习以及多智能体系统之中。

应重点投入

“强化学习”是当前互联网经济场景中,人们希望实现决策智能的核心方法之一。在工业场景下,目前的做法一般是先在平台上模拟,再到现实中进行适应。这种场景下的强化学习一般可以相对准确地进行模拟和应用。

然而,在样本有效性问题上,一旦模拟器模拟出的数据不精确,数据的意义将大打折扣。

上述论坛与会学者介绍说,这是因为,当前的“模拟”多数仅是机械模拟环境,且常用高斯过程的混合模型模拟,仍然处于相对初级的阶段。可以看到,当前的强化学习技术在较复杂场景中往往不能很好地工作,只有序列性强、动作空间简单的场景(如网易云、快手等的音视频推荐)才比较容易刻画。

这也导致,相比于计算机视觉等感知智能,决策智能目前的应用落地仍不明显。针对这一现象,与会学者们认为,虚实混合、数字孪生、教育场景下的搜索推荐等场景都是强化学习有可能产生应用的地方,学术界可以主动进入工业界,一边创业一边研究,进而推动工业界变革。

“人工智能还处在对环境没有适应、认知和学习能力的发展初级阶段。”与会学者认为,决策智能作为人工智能三个流派的融合入口,将成为研究的主流。

“决策智能的基础理论、算法、环境、评价、应用等研究方兴未艾。我国应当将面向重大需求的决策智能作为重点投入、发展和突破的方向。”徐波表示。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 安防管理平台软件的两极分化趋势

    监控管理平台软件除了要具备最基本的音视频操作功能,面临的主要问题就是如何构建面向应用服务的综合管理平台软件,包括:对大型网络环境下分散场所的视频监控设备统一管理,对统一系统不同类型的视频采集设备、报警设备和门禁设备统一管理,对不同部门不同权限用户不同业务需求统一管理。虽然近年来平台软件也有较大发展,但跟整个行业市场相比,还存在一定差距–要么功能貌似很多但不实用,要么架构复杂,成本居高不下,要么运行所需环境简单,无法提供健壮的扩展性,要么操作复杂难以上手。虽然平台软件的重要性不言而喻,但在国内安防行业中却存在着认知度不足、市场规模不大、价值难以体现等窠臼。

    2024年4月6日
  • 校园一卡通系统平台

    平台化的校园一卡通系统:提升教育管理效率和学生生活便利 概述:校园一卡通系统是现代化高校管理的重要支撑,旨在提供方便快捷的支付和身份识别服务。随着技术的不断进步和学校的发展需求,一…

    2023年7月16日
  • 网络与模拟摄像机优势比拼

    模拟摄像机前端采用隔行扫描CMOS/CCD感光器将光信号转换成模拟电信号,然后输出到DSP,由DSP进行A/D转换与色彩调整等处理再做D/A转换调制成PAL/NTSC制式电视信号输出。网络摄像机则是结合模拟摄像机与网络技术产生的新一代摄像机,其内置一个嵌入式芯片,采用嵌入式实时操纵系统。

    2024年4月16日
  • 水星天翼摄像头默认密码(水星天翼摄像头设置和安全建议:防范网络攻击的步骤)

    1.更改默认密码:首先,用户应登录水星天翼摄像头的控制面板或应用程序。找到密码设置选项,通常在“设置”或“安全”标签下。输入当前默认密码,并设置一个新的强密码。确保密码包含字母、数…

    2023年7月23日
  • 监控专用硬盘优势凸显 市场需求受重视

    数字硬盘录像机经常采用多硬盘进行数据存储,以安装8片硬盘为例:普通PC硬盘启动电流2.8×8=22.4A,最低的功耗为22.4A×12V=268.8W。SDVR专用硬盘启动电流2.0A×8=16A,最高的功耗为16A×12V=192W。可以看出,在相同硬盘数量的情况下SDVR专用硬盘对外部电源系统的要求更低(在同样输出功率的外部电源支持下,可以安装的SDVR专用硬盘的数量会更多。

    2024年4月16日
  • 周界集成趋势初显 推动安防智能化发展

    以前由于没有先进的科技,大多数场所都只是在外墙周围设置屏障,如铁栅栏、篱笆网、围墙等。随着市场需求进一步扩大,科学技术的发展推动,从上世纪六十年代开始,各种周界探测技术不断出现,各种入侵探测报警系统融入到安防领域,成为安防领域的重要组成部分――“周界防范”。

    2024年4月14日