美大学联同Facebook开发人工智能玩扑克击败多名世界顶尖选手

加拿大都市网

2019年7月12日 10:12

美国卡内基-梅隆大学宣布，该校和科技巨头facebook合作开发的人工智能Pluribus，在六人桌德州扑克比赛中击败多名世界顶尖选手，成为机器在多人游戏中战胜人类的一个里程碑。

美国《科学》杂志周四在网上发表的相关论文显示，Pluribus与十三名德州扑克高手，进行了10000手不限注对局的六人桌比赛，每次比赛均由机器与5名人类选手对战，结果机器取得胜利。

在另外一种形式的六人桌比赛中，由5个Pluribus与一名人类选手对局，结果机器先后击败了德州扑克世界冠军达伦·伊莱亚斯和克里斯·弗格森，分别各对局5000手。

Pluribus起初和自己对战，一点一滴的学习，透过扑克牌的出牌顺序，获取最佳优势。在比赛中，Pluribus会让自己变得难以预测。例如常规打法是在牌最好的时候押注，但这很快会被对手识破，因此它会“使点小聪明”，不按常理出牌。分析显示，它会做出一些多数人类玩家都认为不好的决策，在客观上迷惑了对手。伊莱亚斯说：“它的主要优点是运用综合策略的能力。”

研究人员指出，与让机器下国际象棋和围棋相比，德州扑克的挑战更大。德州扑克比赛中每方都不知道对手的牌，对手还可能在押注时虚张声势或隐藏关键资讯，因此决策只能基于不完全信息，这与真实世界中的问题更接近。

卡内基-梅隆大学教授图奥马斯·桑德霍尔姆说：“（人工智慧系统）Pluribus在多人扑克中成就了超人的表现，堪称是人工智慧和赛局理论的里程碑。”他表示，此前人工智能在“战略性推理”方面取得的成就仅限于二人游戏，此次在复杂游戏中战胜五名人类选手，将为人工智能解决真实世界问题提供新的可能性。

据介绍，在二人游戏中，机器的策略是实现博弈论中的“纳什均衡”，即确保结果至少是平局，而只要对手犯错打破均衡，机器就能获胜。但这一策略不适用于多人游戏，机器不能保持平局，必须不断争取先手才能最终获胜。研究人员为此设计了一种新的“有限前瞻搜索”算法，让机器能做出一个平衡的整体决策。

桑德霍尔姆和在facebook工智慧部门工作的布朗合作。布朗一边工作一边在匹兹堡的卡内基-梅隆大学完成博士学业。他表示，他本人facebook都没有计划将Pluribus应用在真正的扑克游戏中。事实上，该公司表示大部分代码都不会公开披露，以免对扑克社群产生负面影响。发言人表示，只会向其他人工智能研究人员公开一些技术示例。

2017年，卡内基-梅隆大学开发的人工智能Libratus曾在12万手一对一不限注德州扑克比赛中，分别战胜4名人类选手。

美大学联同Facebook开发人工智能玩扑克击败多名世界顶尖选手

编辑推荐

大统华等华人西人超市最新FLYER！龙虾鲍鱼椰树椰汁特价

多伦多知名中餐馆宣布停业，华人老板经营近20年后退休！

刚刚！Loblaw同意签署加拿大食品杂货行为准则

悲痛！加拿大61岁女子轻微脑震荡被快速安乐死，女儿设法阻止都没用！

Coach Outlet清仓区包包上新一律3折！拒绝黑白灰！

Mountain Warehouse抓绒保暖衣清仓+额外8折两件$20！

加拿大亚裔男因诽谤被重罚$35万常年油管发视频攻击特定对象

Shoppers的招聘信息被网友狂喷！居然是无偿工作…

部分安省居民报告称手机未收到紧急警报官方回应！

Nofrills等西人超市最新传单！西瓜芒果速溶咖啡特价