深度学习已经触到天花板了吗(2)
纽约大学的Gary Marcus写了一篇关于深度学习局限性的文章,并提出了几个令人警醒的观点(在文章传播开之后,他又写了一篇同样有趣的续篇)。Rodney Brooks将时间线放在一起,并通过引用的研究跟踪他的AI炒作周期预测。 对此持怀疑态度的人通常有几个共同点。神经网络需要的数据量非常大,即使在今天,数据仍然是有限的。这也是为什么你在YouTube上看到的“游戏”AI示例通常需要几天不断地输掉游戏,直到神经网络找到对应的获胜模式。 我们确实需要降低我们的期望并停止夸大“深度学习”的能力。如果我们不这样做,我们可能会发现即将又会迎来AI的另一个寒冬。 神经网络“深度”是在于它具有多层节点,而不是因为它对问题产生了深刻的理解。这些层也使神经网络难以理解,对于开发人员也是是如此。最重要的是,当神经网络进入其他问题空间时,例如旅行推销员问题,它会出现回报递减的问题。为什么在搜索算法更加直接、有效、可扩展且经济的情况下,我还要使用神经网络来解决旅行商问题呢? 当然,有些人希望使用神经网络解决更多其他复杂的问题,虽然这很有趣,但神经网络似乎很难超越任何专门的算法。 Luke Hewitt 在《The Unreasonable Reputation of Neural Networks》文章中给出了最好的解释: 需要指出的是,神经网络需要大量的硬件和软件才能进行训练。对我来说,这是不可持续的。当然,神经网络的预测精度比训练时要高得多。然而,为了提高神经网络的精度,它需要不断的被训练,因此训练时消耗的能量和成本成指数级增长。当然,现在计算机的速度越来越快,但芯片制造商能否继续维持摩尔定律呢? 这是有道理的。为什么在搜索算法更加直接、有效、可扩展且经济的情况下,我还要使用神经网络来解决旅行商问题呢? 正是由于这些原因,我认为另一个AI寒冬即将来临。越来越多的专家和博主正在指出这些局限。公司依旧花费大价钱招聘最好的“深度学习”和“人工智能”人才,但我认为许多公司认识到深度学习并不是他们所需要的只是一个时间问题。更糟糕的是,如果你的公司没有Google的研究预算、博士人才或从用户那里收集的海量数据,你很快就会发现你实际的“深度学习”前景非常有限。 在每一个人工智能的寒冬之前,科学家们都在夸大和鼓吹他们创造的潜能。仅仅说他们的算法能很好地完成一项任务是不够的,他们希望它能解决任何任务,或者至少给人一种它可以的印象。例如,AlphaZero特别擅长于下棋,于是媒体的反应是“哦,天哪,通用智能时代来了!机器人来了!”然而科学家们并没有去纠正它们,而是鼓励他们使用这些词汇。毕竟,降低预期并不能帮助风投融资。但是,尽管人工智能研究人员的机器人能力有限,但他们仍然将算法拟人化,他们为什么会这么做呢,这比起科学问题,倒更像是一个哲学问题。 Garry Kasparov在1997年对阵Deep Blue时表示:Rex功能 接下来会面临什么呢? 当然,并不是所有使用“机器学习”或“人工智能”的公司实际上使用了“深度学习”。 一个好的数据科学家可能被雇佣来构建一个神经网络,但当她真正研究这个问题时,她觉得构建一个朴素的贝叶斯分类器可能更合适。对于那些成功使用图像识别和语言处理的公司来说,他们将继续钻研下去。但我认为神经网络并没有在这类问题空间以外的地方取得进展。毕竟,缓和预期对风投融资没有帮助。 过去的人工智能寒冬在推动计算机科学的发展方面是毁灭性的。但是人工智能研究确实产生了一些有用的东西,比如搜索算法可以在国际象棋中夺冠,也可以将运输问题的成本最小化。简单来说,创新性的算法往往只擅长于一个特定的任务。 我想说明的是,许多问题都有都有很多相对应的有效的解决方案。为了不在人工智能的寒冬中冻死,你最好专注于你想要去解决的问题并且理解它的本质。在这基础上,为这个特定问题提供一个直观的解决方案路径。如果你要对文本消息进行分类,可能需要使用朴素贝叶斯分类器。如果你试图优化你的运输网络,可能需要使用离散优化。不管周围的研究者怎么说,你都可以对卷积模型持有怀疑态度,并质疑它的理论是否正确。 如果你不认同毕达哥拉斯派的哲学,那么你能想到的最好方法就是让人工智能“模拟”一些行为,创造出它产生了情感和思想的错觉。 希望这篇文章能让你清楚的意识到,深度学习并不是解决大多数问题的正确方法。不要为所有问题寻求一个通用人工智能解决方案,因为你不可能找到的。 哲学vs科学 我想在这篇文章中提出的最后一点是,这个问题比科学更具有哲学意义。我们的每一个想法和感觉都仅仅是一堆数字以线性代数的方式被乘法和加法吗?难道我们的大脑仅仅是一个神经网络,整天只是在做点积吗?这听起来像是毕达哥拉斯的哲学把我们的意识降维到了一个数字矩阵。也许这就是为什么如此多的科学家相信通用人工智能是可能存在的,因为人类和计算机没有什么差别(我只是在这指出了这一点,并不是评论这个世界观是对还是错)。 不管周围的研究者怎么说,你都可以对卷积模型持有怀疑态度,并质疑它的理论是否正确。 如果你不认同毕达哥拉斯的哲学,那么你能想到的最好方法就是让人工智能“模拟”一些行为,创造出它产生了情感和思想的错觉。翻译程序并不懂得中文,只不过它可以通过寻找概率模式来“模拟”理解中文的假象。当你的智能手机“识别”狗狗的图片时,难道它真的能识别出狗狗吗?还是它只是看到了它以前学习过的数字模式? 相关报道: https://towardsdatascience.com/is-deep-learning-already-hitting-its-limitations-c81826082ac3 (编辑:ASP站长网) |