设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 手机 数据
当前位置: 首页 > 站长资讯 > 动态 > 正文

第三代AI赌神:在六人桌德扑中胜过5个人类顶尖高手(2)

发布时间:2019-07-12 16:17 所属栏目:15 来源:澎湃新闻 举报
导读:Pluribus也变得更加狡猾。如果手上持有场上可能有的最好的牌,那加注是一个理性的选择。但如果每次都在持有好牌时才加注,就可能被对手识破规律。Pluribus会计算在对手来看,自己手上所有可能有的牌型,以及与之相

Pluribus也变得更加狡猾。如果手上持有场上可能有的最好的牌,那加注是一个理性的选择。但如果每次都在持有好牌时才加注,就可能被对手识破规律。Pluribus会计算在对手来看,自己手上所有可能有的牌型,以及与之相对应的表现,最终选定一种均衡的方案。

最后,Pluribus也在计算效率上进行了改进。前一代Libratus用了1500万个核心小时计算出策略,并在1V1现场对决中占用了1400个CPU核数。这一代的Pluribus仅用12400个核心小时就形成蓝图策略,并在现场博弈时占用28个CPU核数。

麦克·加利亚诺(Michael "Gags" Gagliano)说道:“与德扑AI对战,观察它做选择的策略是非常令人激动的。我看到它做了一些人类根本不会去做的下注举动。”

布朗认为,Pluribus的许多创新性的大法可能会在根本上改变这项游戏。例如,绝大多数人类玩家都不会在一个回合末平跟,却在下一回合开始时加注。传统上认为这是一种没有任何战略意义的举动。但是,Pluribus经常会这么做,也许这背后有值得深思的地方。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读