第三代AI赌神：在六人桌德扑中胜过5个人类顶尖高手(2)

发布时间：2019-07-12 16:17 所属栏目：15 来源：澎湃新闻举报

导读：Pluribus也变得更加狡猾。如果手上持有场上可能有的最好的牌，那加注是一个理性的选择。但如果每次都在持有好牌时才加注，就可能被对手识破规律。Pluribus会计算在对手来看，自己手上所有可能有的牌型，以及与之相

Pluribus也变得更加狡猾。如果手上持有场上可能有的最好的牌，那加注是一个理性的选择。但如果每次都在持有好牌时才加注，就可能被对手识破规律。Pluribus会计算在对手来看，自己手上所有可能有的牌型，以及与之相对应的表现，最终选定一种均衡的方案。

最后，Pluribus也在计算效率上进行了改进。前一代Libratus用了1500万个核心小时计算出策略，并在1V1现场对决中占用了1400个CPU核数。这一代的Pluribus仅用12400个核心小时就形成蓝图策略，并在现场博弈时占用28个CPU核数。

麦克·加利亚诺（Michael "Gags" Gagliano）说道：“与德扑AI对战，观察它做选择的策略是非常令人激动的。我看到它做了一些人类根本不会去做的下注举动。”

布朗认为，Pluribus的许多创新性的大法可能会在根本上改变这项游戏。例如，绝大多数人类玩家都不会在一个回合末平跟，却在下一回合开始时加注。传统上认为这是一种没有任何战略意义的举动。但是，Pluribus经常会这么做，也许这背后有值得深思的地方。

（编辑：ASP站长网）