你们把AI吹上了天 但它却依然没4岁的小孩聪明!(2)
在 20 世纪 80 年代,计算机科学家发明了一种巧妙的方法来让计算机检测数据中的模式:链结式(或称神经网络)架构。这种方法在上世纪 90 年代陷入低潮,但最近随着谷歌旗下 DeepMind 等强大的“深度学习”方法的崛起,它又重新焕发了生机。 例如,你可以为一个深度学习程序提供一组标记为“cat”(猫)、“house”(房子)等等的网络图像。该程序能够检测区分这两组图像的模式,并使用这些信息正确地标记新的图像。 被称为非监督式学习的机器学习技术能够从没有标记的数据中检测出模式;它们就是去寻找一组特征——科学家称之为因素分析。在深度学习机器中,这些过程在不同的层级上重复,有些程序甚至可以从像素或声音的原始数据中发现相关的特征,例如计算机可能首先检测原始图像中对应于边和线的的模式,然后在这些模式中找到对应于脸的模式,诸如此类。 另一种历史悠久的自下而上的技术是强化学习。在 20 世纪 50 年代,斯金纳(B. F. Skinner)在约翰·沃森(John Watson)的研究基础上,通过给鸽子安排特定的奖惩活动,控制鸽子去执行复杂的动作——甚至指示空射导弹射向目标。其基本理念是,鸽子得到奖励的行为会重复,而受到惩罚的行为不会重复,直到想要鸽子去做的行为做成了。即便是在斯金纳的时代,这个简单的过程,一遍又一遍地重复,也可能会导致复杂的行为,计算机被设定成一次又一次地执行简单的操作,操作规模之大超出了人类的想象,计算系统可以通过这种方式学习非常复杂的技能。 强化学习(来源于网络) 例如,谷歌的 DeepMind 研究人员将深度学习和强化学习结合起来,教计算机玩雅达利(Atari)的电子游戏,计算机根本不知道这些游戏是怎么玩的,一开始,它的行为是随机的,它也仅仅得到屏幕在每个时刻的样子以及它的得分情况方面的信息,深度学习帮助它解释屏幕上的特征,强化学习则激励系统获得更高的分数,这台计算机很擅长玩其中的几个游戏,但它也完全玩不好其他的对人类而言易如反掌的游戏。 通过以类似的方式结合使用深度学习和强化学习,DeepMind 的 AlphaZero 程序取得了成功,先后在国际象棋和围棋比赛中击败人类棋手,尽管它只具备基本的游戏规则知识和一些谋划能力。AlphaZero 还有一个有趣的特点:它可以与自己进行数亿次的对弈,在此过程中,它会清除导致落败的错误,同时重复和阐明带来胜利的策略,这种系统,以及其他涉及到生成对抗网络技术的系统,会在生成数据的同时也在观察数据。 当你有计算能力将这些技术应用于非常庞大的数据集、数以百万计的电子邮件或 Instagram 图片或者语音记录时,你就得以解决以前看起来非常困难的问题,这就是计算机科学中令人兴奋的地方。 但是值得记住的是,这些问题——比如识别图片里的猫或者像“Siri”这样的口头词——对于一个蹒跚学步的人类来说是轻而易举的,计算机科学最有趣的发现之一是,对我们来说十分容易的问题(如识别猫)对计算机来说却很难——比下国际象棋或围棋困难得多。计算机需要数以百万计的例子来对对象进行分类,而我们只需用几个例子就可以对这些对象进行分类。 自上而下的贝叶斯模型 自上而下的方法在早期的人工智能发展中扮演了重要角色,在 2000 年,它也经历了一次复兴,以概率模型或贝叶斯生成模型的形式出现。 使用这种方法的早期尝试面临两种问题。首先,大多数的例证模式一般可以用许多不同的假设来解释:你来自期刊编辑的电子邮件可能是非垃圾邮件,只是看起来不太可能。其次,生成式模型所使用的概念从何而来?柏拉图和乔姆斯基说,你生来就有这些东西,但是我们如何解释我们是如何学习最新的科学概念的呢?小孩子又是如何理解恐龙和宇宙飞船的呢? 贝叶斯模型将生成式模型和假设检验与概率论相结合,旨在解决这两个问题。贝叶斯模型让你计算出在给定的数据下,某一特定假设成立的可能性,通过对我们已经拥有的模型进行小的系统性调整,并根据数据对其进行检验,我们有时可以从旧的概念和模型中创建新的概念和模型,但是这些优势被其他的问题所抵消,贝叶斯技术可以帮助你选择两个假设中哪个更有可能,但几乎总是有大量的潜在假设,没有一个系统可以有效地全盘考虑它们。 贝叶斯模型(来源于网络) 纽约大学的布伦登·莱克(Brenden Lake)和他的同事们用这种自上而下的方法解决了另一个对人类而言很简单,但对计算机非常困难的问题:识别不熟悉的手写字符。看看日本画卷上的一个字,即使你以前从未见过它,你也可以分辨出它是否与其他日本画卷上的字符相似或不同,你可能能够画出它来,甚至可以根据你看到的这个字符设计出一个虚假的日本字符。 用于识别手写字符的自上而下方法是,给计算机就每个字符提供数千个例子,并让计算机提取出显著的特征,而莱克团队则是给这个程序提供一个字符书写过程的通用模型:笔画要么向右,要么向左,完成一个笔画以后,开始写另一个,等等,当程序看到一个特定的字符时,它可以推断出最可能导致这个字符生成的笔画顺序——就像你基于垃圾邮件形成过程推断出你的邮件可能是垃圾邮件一样,然后它就可以判断一个新字符是来自于这个笔画顺序还是来自于另一个不同的笔画顺序,它自己也可以产生一组类似的笔画。 这个程序比应用于完全相同的数据的深度学习程序要有效得多,而且它切实反映了人类的行动过程。 这两种机器学习方法各有优缺点,在自下而上的方法中,程序一开始并不需要太多的知识,但是它需要大量的数据,并且只能以限定的方式进行归纳,在自上而下的方法中,程序可以从几个示例中学习,并做出更广泛、更多样的归纳,但是你需要在开始时为其灌输更多的东西,许多研究人员目前正试图将这两种方法结合起来,利用深度学习来实现贝叶斯推理。 人工智能最近的成功在一定程度上是源于那些旧思想的延伸,但更重要的是,多亏了互联网,我们有了更多的数据,多亏了摩尔定律,我们有了更多的计算能力来应用那些数据。 (编辑:ASP站长网) |