机器人在人机协作团队中成“领导”?工作原理为何?
随着机器人技术的发展,机器人在实际生活中发会越来越重要的作用。它不仅只是根据人类的指令来行动,更开始在人机协同工作中开始发挥引导人类工作的作用。本文介绍了斯坦福 AI 研究院的研究人员如何应用领导者-跟随者图(LFG)来更好地发挥机器人在团队中的领导作用。 我们的生活大多围绕着团队协作。例如,我们在与人群协作或影响人群时,既能够以显而易见的方式(如一起做饭时),也能够以不易察觉的方式(如在高速公路上共享车道时)。随着机器人越来越融入社会,它们应该能够很好地与人类群体协作。 然而,要影响人群是具有挑战性的。例如,想象一下在一个志愿搜救任务中,无人机学习关于目标位置的最新信息(如下面的蓝色标记所示)。假设没有直接的通讯方式,无人机应该如何带领志愿者前往那个地点? 无人机领导团队的一种方式,是分别对每个个体进行建模并单独施加影响。其中,无人机建模的用意在于理解并预测某个人的行为。然而,独立于他人的建模和影响并不能很好地扩展到人数更多的个体,而且我们无法在进行在线快速计算。 影响人类团队的另一种方法是放弃任何建模,直接从对团队的观察中学习策略或行动规划。这种方法为人数同样多的团队提供了一个合理的解决方案。但是,添加或减去一个团队成员会改变模型的输入大小,并且需要重新训练模型。 我们取得成果如下:
人类群体的潜在结构 与为群体中的每个个体建模不同,我们的核心思想是关注个体之间的建模关系。当在群体中互动时,我们不再孤立地行动,而是根据他人的行动有条件地行动。这些依赖关系提供了一种结构,我们可以使用这种结构来形成对他人的期望,并据此行事。在更大的范围内,这允许我们发展出规范、惯例,甚至文化。这些依赖关系对机器人很有用。因为它们提供了丰富的信息源,可以帮助机器人建模和预测人类行为。我们称这些依赖关系为潜在结构。 潜在结构的一个重要例子是领导和跟随行为。我们可以很容易地组成团队,并决定是否应该跟随或带领团队高效地完成任务。例如,在搜救任务中,一旦发现目标的新信息,人类就能自发地成为领导者。我们还默默地协调领导和跟随策略。举个例子,当司机开车时,他们会跟随对方穿过车道。在工作中,我们将重点建模潜在的引导和跟随结构,并将它作为一个运行示例。 在搜救任务中,志愿者之间潜在的领导和跟随结构的例子(左图),以及车辆在交通中相互跟随的例子(右图)。 那么我们该如何对这些潜在结构进行建模呢?理想模型应该具有哪些性质呢?在讨论如何建立潜在结构模型之前,让我们先确定一些必备要素?
潜在结构建模 最简单的情况 我们使用监督学习方法来估计两个人类智能体之间的关系。回到必备要素的讨论,这解决了复杂性的问题,因为使用基于学习的方法允许我们捕获这对组合可能拥有的复杂关系。使用模拟器,我们可以要求参与者演示我们想要度量的期望关系,例如领导和跟随。 我们将搜救任务抽象为一个游戏,其中目标代表潜在的幸存者位置。在下面的例子中,参与者被要求互相领导和跟随,以便集体决定要达成的目标。与人有关的数据通常充满噪音,很难大规模收集。为了弥补这个缺点,我们用模拟的人类数据扩充了我们的数据集。然后,我们将这些数据输入神经网络模块。这些模块经过训练,可以预测前导关系和后导关系。这为我们提供了一个模型,可以评估每个智能体以及目标成为智能体的领导者的可能性。 扩大团队规模 现在,我们如何给一个更大的团队建模呢?使用上面的模型,我们可以通过计算所有智能体和目标之间成对关系的得分,将多个人类之间的关系表示为一个图。每个描述的边都有一个由我们训练过的神经网络分配的概率(概率在下面的图中抽象出来)。 (编辑:ASP站长网) |