论AI自动化思维中的隐性成本(2)
机器学习模型已经愈发普遍,任何人都能够创建起自己的机器学习模型,这也让统计审查工作变得越来越困难。但这仍然非常重要,因为孤立系统虽然能够产生有用的结果,但这些系统本身却不会孤立地存在:当AI技术收集并提取真实世界中的数据时,它们也会产生属于自己的数据,而其中大部分结论都会作为其它系统的输入内容。正如原理未知的药物之间可能发生相互影响一样,债务负担算法也将面对类似的挑战。 另外,即使是最简单的交互也可能引发麻烦。2011年,一位名叫Michael Eisen的生物学家从他的一名学生身上发现了有趣的案例:一名毫不起眼的旧书《飞翔的奥秘:动物设计中的遗传学(The Making of a Fly: The Genetics of Animal Design)》在亚马逊网站上最低的开价竟然高达170万美元——还要再加上3.99美元的运费。第二低的价格则迅速攀升至210万美元。这两位卖家都是亚马逊上的老店,店铺里也都有着非常积极的评论。而当Eisen连续几天访问该书的页面时,他发现价格一直在不断增加,且似乎遵循着一定的规律。卖家甲的价格一直是卖家乙价格的99.83%;而第二天,卖家乙的价格则会上调至卖家甲前一天价格的127.059%。Eisen推断,卖家甲肯定是真的拥有这本书,而且打算长期占据亚马逊上最低的价格。与此同时,卖家乙没有这本书,所以把价格定得更高;这样如果有人购买,卖家乙可以当一把“二道贩子”,直接拍下卖家甲的商品。 这两位卖家的推定策略都非常理性,但双方采取的算法在相互作用之后产生了不合常理的结果。同理可知,成千上万套机器学习系统在实际运行当中几乎必然会带来更难以预测的结果。正在大规模部署前沿机器学习系统的金融市场,为这类问题提供了理想的温床。2010年,在令人痛苦的36分钟之内,由算法交易驱动的“闪电崩盘”事件从美国各大主要经济指数中蒸发掉超过1万亿美元财富。去年秋季,J.P.摩根分析师Marko Kolanovic认为,这种崩溃事件很可能再次发生,因为如今更多交易开始以自动化系统为基础。知识债务可能在这些系统之间相互碰撞并不断积累,甚至影响到彼此并未直接交互的系统。如果没有类似于资产负债表的制度存在,我们将无法预测或者追溯事件的前因后果,更无法确定我们是否值得承担知识债务、我们又能够承担多少知识债务。 知识债务的增加,也有可能改变我们对基础科学以及对应用技术的思考方式。与粒子加速器这类由政府机构斥巨资兴建、并由学术研究机构代为运营的项目不同,机器学习工具能够快速在私营企业与学术组织内传播。实际上,谷歌与Facebook获取预测性数据素材的能力要远超任何计算机科学或者政府统计部门。在生意人来看,这些知识能不能解释好像没什么关系,但知识债务在客观上仍将快速累积。最终,问题将落在企业手中,而非真正有意解决这一切的学术研究人员。 可以想象,源自机器学习的知识不断增长,也将使得赞助资金越来越多地涌向那些乐于利用AI技术(而非以人工方式慢慢推进项目)的研究人员手中。去年12月,研究蛋白质折叠的研究员Mohammed AlQuraishi撰写了一篇论文,探讨自己在所在领域的最新成果:创建一套能够以高于人类研究员的准确度预测蛋白质折叠情况的机器学习模型。AlQuiraishi对自己无法探明数据理论感到遗憾,并表示自己投入大量精力但仍一无所获。他在接受采访时表示,“那些能够提供新的分析洞察力概念的论文或者相关成果,实际未能得到同样的重视。”随着机器发现速度的加快,人们可能认为这些坚持旧有研究方式的家伙是一帮异类——多此一举而且无可救药地落后于时代。相反,针对某一特定领域的知识发现类机器学习模型则比知识本身更有价值,因为它们能够更快地为该主题提供答案。 金融债务的控制权会转移——由贷款人到贷方,从未来到过去等。同样的,知识债务也有可能发生控制权转移。当这个由未知知识构成的世界逐步转化为缺少明确因果关系的世界,我们却又不得不依赖这种模糊的方式告诉自己该做什么、什么时候去做。例如,高校的招生委员会可能会把筛选工作交给机器学习技术,而后者将负责把申请人的努力与不确定性转化为清晰的模式;这种模式也许将优化大学生群体,使他们不仅更有能力在学业上取得成功,同时也建立起和谐的师生关系并乐于为学校提供慷慨的捐赠。此外,未来我们理解世界的唯一方式,可能是利用自己的AI神经网络调整社交媒体上的个人资料,从而让自己更轻松地融入目标群体。 也许这一切都将成为现实,但其反过来又会引发新的问题。大多数对于人工智能的批评意见,主要集中在它们可能犯下的错误:它会创造或复制偏见;它会犯错误;也可能被用于实现邪恶的目的。但除此之外,我们还有其它值得担心的问题,例如:就算AI做对了,又将意味着什么?
(编辑:ASP站长网) |