当前位置:首页 > 理财有道

柯洁人机大战 人机大战 柯洁怎么就输了?

前向预警,前向高能预警,前向核能预警,文中可能有各种你听不懂但我并不是很懂的专业术语。

可以打开电脑看百度。

昨天柯洁和阿尔法狗完成了第一局。不,他们完成了第一场比赛。最终结果以阿尔法狗胜出告终,柯洁也在下期贡献了不少表情包。另外,这个人叫柯洁,既不是何洁,也不是米歇尔,更不是柯南。

根据Deepmind团队的预测,和柯洁交手的AlphaGo Master比去年和李世石交手的AlphaGo Lee强三倍。

三个孩子是什么概念?引用柯洁的话,一个武林高手和他对决,对手让你先捅他三刀。有网友嘲讽这意味着柯洁比李世石强三个孩子。

李世石在厕所里哭晕了,躺着被枪杀

不管是李世石还是柯洁,其实在下一期,他们要面对的是帮助阿尔法狗倒下的黄士杰,也就是阿尔法狗背后的驱动力。

阿尔法狗为什么不能做成机器人,偶尔可以下棋和对手互动?是不是看起来更“正常”?对于一台机器来说,这一点都不简单。

我们都知道围棋棋盘是什么样子的。板子上有19条直线,把板子分成361个交点。棋子走在路口。在这么大的空空间里,人类需要耗费大量的脑力和体力才能找到最好的安身之处。但是AI不需要。他们能加热的只有CPU。人工智能只需要用庞大的数据做出来,就可以利用其快速的计算速度来优化搜索。

这里我们将介绍三个概念,即深度学习、强化学习和蒙特卡罗树搜索(MCTS)。

深度学习主要用于学习和构建两个模型网络。一种是评价棋盘目前的状态。也就是说,给当前棋盘状态打一个分,评估获胜的期望值,就是ValueNetwork。输入是棋盘19x19各点的状态,有无子,输出是获胜的期望值。

如果你够聪明,你可以找个数学家,在黑板上写个公式表示出来。而人工智能还没有被教会“随机响应”和“积分”的功能,所以只能用多层神经网络来近似表达这种高级功能。

第二,根据棋盘目前的状态,决定下一颗棋子应该怎么走才有最大的获胜概率,这就是AlphaGo的PolicyNetwork。也就是说,给定19x19的棋盘状态,这是所有空中的最佳选择,将具有最大的胜率。

同样,我们也可以用一个函数来描述,比如输入是当前的棋盘状态,输出是各个位置的期望值和它的期望胜率。但是这个函数没有高级的数学公式,所以最后求助于多层神经网络。

那么人工智能扮演的所谓深度学习网络是怎样的呢?这里我们要提出另一个术语,叫做随机梯度下降(SGD)。

Go没有求解公式,或者相对简单的求解公式,所以人工智能只能求助于迭代和随机梯度下降迭代。简单解释一下,就是摸着石头过河。人工智能努力工作,直到得到满意的结果。这个过程循环往复,但本身就很简单。按照我们的话说,人工智能用的是最“蠢”的方法。如果我们做选择题的时候发现这个公式里有四个选项,那么最傻的办法就是把这四个选项都拿进去,再数一遍。这就是人工智能风格的方法。

当然,基础数据已经被前辈输入到了Alpha Dog的服务器中,Alpha Dog不可能用庞大的数据量进行现场计算。这样一来,阿尔法狗在下棋的时候就可以大大减少搜索空的次数,把不好的都消灭掉。

那么,如果阿尔法狗认为不好的地方不一定不好呢?这是强化学习的领域,也就是自我发挥。就拿武侠小说的套路来说,这叫右撇子交流。说白了就是两只阿尔法狗对弈,通过深度学习的网络模式来记录,从而提高前两种模式的网络效果。在强化学习算法中,需要进行大量迭代计算才能得到最优期望,即达到收敛。

到这个时候,阿尔法狗就可以算是普通玩家了。但是在很多选择都没有选择的情况下,阿尔法狗如果不能保证模型预测的每一步都是最好的,该怎么办?

最后一个名词是蒙特卡洛树搜索。这是一个通过随机推演博弈逐步构建不对称搜索树的过程。可以分为四个步骤。选择、扩展、模拟和反向传播。

简单来说,一个一个尝试,简单粗暴。摘麦穗的故事大家都知道吧?从田地的开始到结束,挑出最大的麦穗。有的版本摘苹果,但都差不多。蒙特卡洛树搜索就是从一开始就拿出一堆麦穗或者一个苹果,一个个对比到底。那你一定要挑很多遍,不然你也不知道你挑的是不是最大的。只是人力有限。你不知道你挑的最后一个是不是最大的,但你可以保证绝对是比较大的。

听着,你累了吗?

但是阿尔法狗就是这么“不灵活”,或者说无法“绕过”。人类教会了阿尔法狗最愚蠢的方法。要不是它的计算速度快,数据量大,也打不过今天的柯洁。

这样的阿尔法狗也许能打败柯洁,也许能赢得星际种族,但注定写E = MC2;这个公式。人类擅长学习迁移,但人工智能还做不到这一点。

赛后,有网友发现王思聪竟然跑到柯洁的微博上嘲讽道:“哎,李和alphago倒下了,你的嚣张气焰去哪了?”就这么一句话。

总的来说,王思聪的很多观点都会得到网友的大力支持。但这次情况有点不同。王思聪被网友激怒。

1.《柯洁人机大战 人机大战 柯洁怎么就输了?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《柯洁人机大战 人机大战 柯洁怎么就输了?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/caijing/1450364.html

上一篇

天津渤海钢铁集团 渤海钢铁集团正式进入破产重整程序

下一篇

黛珂中国官网 高丝集团在天猫开出第七家官方旗舰店 黛珂10天预售破千万

围棋人机 2017围棋人机大战直播:柯洁VS阿尔法狗

围棋人机 2017围棋人机大战直播:柯洁VS阿尔法狗

北京时间5月25日10:30,浙江乌镇,2017围棋人机大战第二局将在此继续。 游戏性质:2017围棋人机大战第二场 现场比赛:柯洁VS Alphago (Alpha Dog) 直播时间:2017年5月25日星期四10...

全球变暖的大骗局 全球变暖真的是一场世纪骗局?到底是谁撒了谎?

  • 全球变暖的大骗局 全球变暖真的是一场世纪骗局?到底是谁撒了谎?
  • 全球变暖的大骗局 全球变暖真的是一场世纪骗局?到底是谁撒了谎?
  • 全球变暖的大骗局 全球变暖真的是一场世纪骗局?到底是谁撒了谎?
船袜有胶的是怎么穿

船袜有胶的是怎么穿

船袜通常后跟有乳胶条,可以防滑,增加袜子与脚的摩擦力。带乳胶条的船袜和普通船袜穿起来一样。袜子历史悠久,有三四千年的历史。随着纺织工业的发展,出现了各种材质、形状、款式的袜子。船袜最早起源于日本,室内习惯赤脚穿着。现在...

隔墙有眼 隔着墙也能看清你的姿势 人工智能如何练就“穿墙透视”

隔墙有眼 隔着墙也能看清你的姿势 人工智能如何练就“穿墙透视”

一个测试人员走进房间,他的下肢图像显示在窗户下面。随后,测试者被墙壁完全挡住,但人的骨骼却完全显示出来。上图:房间里三个人。下图:通过人工智能视角看到的三个人。古人云,隔墙有耳。但是,能看破墙似乎是一种遥不可及的技能。...

作弊工具 多人网上买卖考试作弊器被抓 更可悲的是:根本不好用

作弊工具 多人网上买卖考试作弊器被抓 更可悲的是:根本不好用

2008年6月8日——在网上购买作弊设备“助考”不仅无助于考试,还触及了法律的红线。近日,黑龙江省网络安全部门破获11起网上购销作弊设备案件,抓获犯罪嫌疑人23人,追回无线作弊设备47台。警方查获的一些作弊设备。今年5...

考试作弊工具 多人网上买卖考试作弊器被抓 更可悲的是:根本不好用

考试作弊工具 多人网上买卖考试作弊器被抓 更可悲的是:根本不好用

2008年6月8日——在网上购买作弊设备“助考”不仅无助于考试,还触及了法律的红线。近日,黑龙江省网络安全部门破获11起网上购销作弊设备案件,抓获犯罪嫌疑人23人,追回无线作弊设备47台。警方查获的一些作弊设备。今年5...

360翻译 360搜索上线翻译频道 人工智能助力跨语种沟通

随着中国国际化的深入,出国旅游、留学、海淘、看国外新闻的需求越来越大。跨文化、跨语言交际离不开各种翻译工具。最近重金推出360翻译。基于独家先进的神经网络机器翻译技术——360 NMT模型,支持汉英翻译、单词解释和例句...

皮肤病诊断 中国首个皮肤病人工智能辅助诊疗综合平台正式上线

皮肤病诊断 中国首个皮肤病人工智能辅助诊疗综合平台正式上线

开幕式现场华盛在线4月27日讯今天上午,由中南大学湘雅二医院、丁香园、瑞琪软件联合开发的中国首个人工智能辅助皮肤病诊疗综合平台在湖南长沙正式上线。目前,该系统对近100种常见皮肤病的平均识别准确率在85%以上,最高可达...