AI再跃进 比AIphaGo更猛 Pluribus完胜德州扑克

来源:新闻中心作者/编辑:编辑 2019年08月06日

AI再跃进 比AIphaGo更猛 Pluribus完胜德州扑克

Pluribus在六人桌德州扑克比赛中击败一众世界顶尖选手。网络图片

【今日时报网讯】美国卡内基梅隆大学当地时间11日宣布,该校和fb合作开发的AI Pluribus在六人桌德州扑克比赛中击败一众世界顶尖选手,成为机器在多人游戏中战胜人类的一个里程碑。此前,谷歌的AIphaGo战胜人类棋手早已闻名于世,其升级版AIphaGo Zero更是通过纯强化学习实现自我进化,仅用40天便将上两代AIphaGo秒杀,甚至走出了人类根本不知晓的棋法。

击败一众人类顶尖选手

美国《科学》杂誌11日在线发表的相关论文显示,Pluribus与13名德州扑克高手进行了1万手不限注对局的六人桌比赛,每次比赛中由机器对5名人类选手,结果机器取得胜利。在另外一种形式的六人桌比赛中,由5个Pluribus与1名人类选手对局,结果机器分别在5000手对局中先后击败了德州扑克世界冠军伊莱亚斯和弗格森。

更接近真实世界问题决策

在比赛中,Pluribus会让自己变得难以预测。例如常规打法是在牌最好的时候押注,但这很快会被对手识破,因此Pluribus会不按常理出牌。分析显示,Pluribus会做出一些多数人类玩家都认为不好的决策,这在客观上也迷惑了对手。

研究人员指出,这次胜利是AI研究的重要里程碑。与让机器下国际象棋和围棋相比,德州扑克的挑战更大。德州扑克比赛中每方都不知道对手的牌,对手还可能在押注时虚张声势,因此决策只能基于不完全信息,这与真实世界中的问题更接近。

卡内基梅隆大学教授桑德霍尔姆说,此前AI在「战略性推理」方面取得的成就仅限于二人游戏,此次在複杂游戏中战胜5名人类选手,将为AI解决真实世界问题提供新的可能性。

据介绍,在二人游戏中,机器的策略是实现博弈论中的「纳什均衡」,即确保结果至少是平局,而只要对手犯错打破均衡机器就能获胜。但这一策略不适用于多人游戏,因此机器不能保平,必须不断争取先手才能最终获胜。研究人员为此设计了一种新的「有限前瞻搜索」算法,让机器能做出一个平衡的整体决策。

2017年,卡内基梅隆大学开发的AILibratus曾在12万手一对一不限注德州扑克比赛中分别战胜4名人类选手。

AI再跃进 比AIphaGo更猛 Pluribus完胜德州扑克
AI再跃进 比AIphaGo更猛 Pluribus完胜德州扑克
上一篇:华为或将在8月9日公布自研操作系统“鸿蒙”
下一篇:苹果为保密操碎了心:有工人想挖地道偷零件未成

分享到