AI、机器学习和深度学习的区别到底是什么？

AI（人工智能）是未来，是科幻小说，是我们日常生活的一部分。所有论断都是正确的，只是要看你所谈到的AI到底是什么。

例如，当谷歌DeepMind开发的AlphaGo程序打败韩国职业围棋高手Lee Se-dol，媒体在描述DeepMind的胜利时用到了AI、机器学习、深度学习等术语。AlphaGo之所以打败Lee Se-dol，这三项技术都立下了汗马功劳，但它们并不是一回事。

要搞清它们的关系，最直观的表述方式就是同心圆，最先出现的是理念，然后是机器学习，当机器学习繁荣之后就出现了深度学习，今天的AI大爆发是由深度学习驱动的。

从衰败到繁荣

1956年，在达特茅斯会议（Dartmouth Conferences）上，计算机科学家首次提出了“AI”术语，AI由此诞生，在随后的日子里，AI成为实验室的“幻想对象”。几十年过去了，人们对AI的看法不断改变，有时会认为AI是预兆，是未来人类文明的关键，有时认为它只是技术垃圾，只是一个轻率的概念，野心过大，注定要失败。坦白来讲，直到2012年AI仍然同时具有这两种特点。

在过去几年里，AI大爆发，2015年至今更是发展迅猛。之所以飞速发展主要归功于GPU的广泛普及，它让并行处理更快、更便宜、更强大。还有一个原因就是实际存储容量无限拓展，数据大规模生成，比如图片、文本、交易、地图数据信息。

AI：让机器展现出人类智力

回到1956年夏天，在当时的会议上，AI先驱的梦想是建造一台复杂的机器（让当时刚出现的计算机驱动），然后让机器呈现出人类智力的特征。

这一概念就是我们所说的“强人工智能（General AI）”，也就是打造一台超棒的机器，让它拥有人类的所有感知，甚至还可以超越人类感知，它可以像人一样思考。在电影中我们经常会看到这种机器，比如 C-3PO、终结者。

还有一个概念是“弱人工智能（Narrow AI）”。简单来讲，“弱人工智能”可以像人类一样完成某些具体任务，有可能比人类做得更好，例如，Pinterest服务用AI给图片分类，Facebook用AI识别脸部，这就是“弱人工智能”。

上述例子是“弱人工智能”实际使用的案例，这些应用已经体现了一些人类智力的特点。怎样实现的？这些智力来自何处？带着问题我们深入理解，就来到下一个圆圈，它就是机器学习。

机器学习：抵达AI目标的一条路径

大体来讲，机器学习就是用算法真正解析数据，不断学习，然后对世界中发生的事做出判断和预测。此时，研究人员不会亲手编写软件、确定特殊指令集、然后让程序完成特殊任务，相反，研究人员会用大量数据和算法“训练”机器，让机器学会如何执行任务。

机器学习这个概念是早期的AI研究者提出的，在过去几年里，机器学习出现了许多算法方法，包括决策树学习、归纳逻辑程序设计、聚类分析(Clustering)、强化学习、贝叶斯网络等。正如大家所知的，没有人真正达到“强人工智能”的终极目标，采用早期机器学习方法，我们连“弱人工智能”的目标也远没有达到。

在过去许多年里，机器学习的最佳应用案例是“计算机视觉”，要实现计算机视觉，研究人员仍然需要手动编写大量代码才能完成任务。研究人员手动编写分级器，比如边缘检测滤波器，只有这样程序才能确定对象从哪里开始，到哪里结束；形状侦测可以确定对象是否有8条边；分类器可以识别字符“S-T-O-P”。通过手动编写的分组器，研究人员可以开发出算法识别有意义的形象，然后学会下判断，确定它不是一个停止标志。

这种办法可以用，但并不是很好。如果是在雾天，当标志的能见度比较低，或者一棵树挡住了标志的一部分，它的识别能力就会下降。直到不久之前，计算机视觉和图像侦测技术还与人类的能力相去甚远，因为它太容易出错了。

深度学习：实现机器学习的技术

“人工神经网络（Artificial Neural Networks）”是另一种算法方法，它也是早期机器学习专家提出的，存在已经几十年了。神经网络（Neural Networks）的构想源自于我们对人类大脑的理解――神经元的彼此联系。二者也有不同之处，人类大脑的神经元按特定的物理距离连接的，人工神经网络有独立的层、连接，还有数据传播方向。

例如，你可能会抽取一张图片，将它剪成许多块，然后植入到神经网络的第一层。第一层独立神经元会将数据传输到第二层，第二层神经元也有自己的使命，一直持续下去，直到最后一层，并生成最终结果。

每一个神经元会对输入的信息进行权衡，确定权重，搞清它与所执行任务的关系，比如有多正确或者多么不正确。最终的结果由所有权重来决定。以停止标志为例，我们会将停止标志图片切割，让神经元检测，比如它的八角形形状、红色、与众不同的字符、交通标志尺寸、手势等。

神经网络的任务就是给出结论：它到底是不是停止标志。神经网络会给出一个“概率向量”，它依赖于有根据的推测和权重。在该案例中，系统有86%的信心确定图片是停止标志，7%的信心确定它是限速标志，有5%的信心确定它是一支风筝卡在树上，等等。然后网络架构会告诉神经网络它的判断是否正确。

即使只是这么简单的一件事也是很超前的，不久前，AI研究社区还在回避神经网络。在AI发展初期就已经存在神经网络，但是它并没有形成多少“智力”。问题在于即使只是基本的神经网络，它对计算量的要求也很高，因此无法成为一种实际的方法。尽管如此，还是有少数研究团队勇往直前，比如多伦多大学Geoffrey Hinton所领导的团队，他们将算法平行放进超级电脑，验证自己的概念，直到GPU开始广泛采用我们才真正看到希望。

回到识别停止标志的例子，如果我们对网络进行训练，用大量的错误答案训练网络，调整网络，结果就会更好。研究人员需要做的就是训练，他们要收集几万张、甚至几百万张图片，直到人工神经元输入的权重高度精准，让每一次判断都正确为止――不管是有雾还是没雾，是阳光明媚还是下雨都不受影响。这时神经网络就可以自己“教”自己，搞清停止标志的到底是怎样的；它还可以识别Facebook的人脸图像，可以识别猫――吴恩达（Andrew Ng）2012年在谷歌做的事情就是让神经网络识别猫。

吴恩达的突破之处在于：让神经网络变得无比巨大，不断增加层数和神经元数量，让系统运行大量数据，训练它。吴恩达的项目从1000万段YouTube视频调用图片，他真正让深度学习有了“深度”。

到了今天，在某些场景中，经过深度学习技术训练的机器在识别图像时比人类更好，比如识别猫、识别血液中的癌细胞特征、识别MRI扫描图片中的肿瘤。谷歌AlphaGo学习围棋，它自己与自己不断下围棋并从中学习。

有了深度学习AI的未来一片光明

有了深度学习，机器学习才有了许多实际的应用，它还拓展了AI的整体范围。深度学习将任务分拆，使得各种类型的机器辅助变成可能。无人驾驶汽车、更好的预防性治疗、更好的电影推荐要么已经出现，要么即使出现。AI既是现在，也是未来。有了深度学习的帮助，也许到了某一天AI会达到科幻小说描述的水平，这正是我们期待已久的。你会有自己的C-3PO，有自己的终结者。