十三.“人类没有真正的胜算”
托马斯·桑德霍姆(Thomas Sandholm)教授解释说:“在两个参与者的零和博弈中,如果一个参与者不遵循纳什均衡策略,两个参与者都会失去利润,但我们的系统不会。在这种博弈中,考虑纳什均衡是最安全的。遵守规则的玩家将获得合理的利益,不会被对手利用到任何地方。”
这次比赛规则和2015年基本一致,比赛时间从13天延长到20天。依然基于无限下注规则,天平动轮流与人类高手一对一对弈。人类团队计算出总分,并与天平动的总分进行比较。不同的是升级后的天平动程序,就像Go板上的AlphaGo一样,一上来就彻底压制了四个人类高手。AI从比赛第一天就一路领先。虽然领先优势在第六天一度缩小,但是第七天之后,人类已经没有机会缩小巨大的差距了。最终,天平动的领先芯片达到了惊人的176.6万美元!德州扑克人机对战,人工智能完美胜出!
曾在2015年和2017年参加过两次人机大战的德州扑克人类大师东金(DongKim)说,他在整个比赛中充满了挫败感——事实上,他已经是四个人类大师中最好的了。两年前打败电脑的东金在2017年的比赛中直言不讳地说:“人类没有真正的获胜机会。”
那么,从天平动打败人类高手的德州扑克游戏中,我们能看到人工智能的哪些发展规律?
根据我对天平动的比赛观察,天平动使用的技术策略非常成功。AI使用增强学习技术,从自我匹配中学习到最好的扑克游戏,避免从人类既定的模式中学习经验,这一点非常重要。当然,天平动的算法只适用于无限注的一对一比赛。如果比赛扩展到更常见的多人比赛,天平动将面临更多挑战,需要升级调整策略。
计算机在德州扑克领域的成功让包括我在内的人工智能研究人员非常兴奋,主要有以下两个原因:
与围棋不同,人工智能和人类玩家一样,只能在德州扑克的牌桌上看到一些信息。在这种情况下,就没有所谓的独一无二,最好玩。
天平动基本上是从零开始学习德州扑克策略,主要靠自玩学习。利用人工智能解决更广泛的实际问题具有重要意义。
担心人工智能威胁的悲观主义者可能会从天平动的胜利中看到更现实的风险。例如,机器使用大赌注和新策略来吓跑和欺骗比赛中最聪明的人类玩家。这些方法可能被精明的商人在人类商业谈判中使用。这些人工智能算法一旦被犯罪组织利用,会有灾难性的后果吗?担心超级人工智能出现的人会进一步问,机器一旦有了自我意识,会不会像德州扑克桌上的AI算法一样,用各种策略来欺骗和恐吓人类?
乐观者更意识到天平动的算法对于人工智能帮助人类解决实际问题的巨大价值。如果机器能在自我学习中不断提高对某一特定策略的掌握,并能在不熟悉或缺乏全部信息的情况下不断尝试犯错和积累经验,那么机器显然能胜任更多的人类工作。比如,机器可以帮助人类制定更复杂的医疗计划,可以在人类难以做出决策的领域,比如商业活动、城市规划、经济调控甚至战争指挥等领域充当人类的“参谋”。也许,在未来,每个人都可以依靠强大的计算机和人工智能程序成为战略家。
1.《德州扑克比赛规则 十三、“人类已经没有真正获胜的机会”》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《德州扑克比赛规则 十三、“人类已经没有真正获胜的机会”》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guoji/1372122.html