10月19日,据外媒报道,由谷歌子公司DeepMind开发的针对Go的人工智能程序AlphaGo迎来了AlphaGo Zero的新版本。
DeepMind详细解释了AlphaGo和Zero的区别。比如识别棋盘面时,直接识别黑白棋子,而不是对图像进行分类;它只用一个人工神经网络,把前面两个结合成一个。但更大的创新是AlphaGo Zero采用了一种新的算法“强化学习”。每次训练后,AlphaGo Zero可以根据训练结果进一步优化其算法。
最初的AlphaGo需要和人类专家玩上千种游戏才能从中获取数据,而AlphaGo Zero则截然不同。虽然也是DeepMind开发的,但是从零开始,只面对一个空白色棋盘和游戏规则,只是通过自学提高了游戏技能。
▲ AlphaGo Zero自我游戏训练流程
经过三天的训练,AlphaGo Zero已经能够击败AlphaGo Lee,这是去年击败韩国顶尖选手李世石的系统,比分高达100: 0。
经过40天的训练,AlphaGo Zero已经打出了2900万左右的自我游戏,以89: 11的比分击败了AlphaGo Master(今年早些时候击败世界冠军柯洁的系统)。
此外,AlphaGo Zero比前几代产品更节能。AlphaGo Lee需要用几台机器和48台谷歌TPU机器来学习加速芯片。上一代AlphaGo Fan用的是176 GPU芯片。AlphaGo Zero只需要使用一台带有四个TPU的机器。
对于alphago Zero的推出,柯洁在微博上写道:“一个纯粹的、自学的alphago是最强的...为了AlphaGo的自我提升...人类太多余了。」
1.《alphago柯洁 打败柯洁的 AlphaGo,被弟弟 AlphaGo Zero 打败了》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《alphago柯洁 打败柯洁的 AlphaGo,被弟弟 AlphaGo Zero 打败了》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/817339.html