智力物品(公众号:zhidxcom)

文|莉娜

池东东在5月23日下午,今天与世界围棋第一人Kerjee Deepmind旗下Alpha GO进行了4个半小时的围棋大战,最终以1/4的差距惜败Alpha GO。上午10点30分开始的这场战终于结束了。大卫亚设(David Assere),Northern Exposure(美国电视剧)。

在这次围棋比赛中,kj对阿尔法狗3场比赛中的第一场比赛,kj继续黑色先行。(威廉莎士比亚、温斯顿、围棋、围棋、围棋、围棋、围棋、围棋)与今年年初穿着“大师”背心的连胜60场比赛不同,这次的“Kogo大战”对人类有一定的优势,包括一方下3个小时的慢棋,而不是一手下30秒的快棋。(伯纳德肖,北方专家)。

理论上,这场比赛将持续3 3=6个小时,但最终Kirzer用了近3个小时,Alpha GO用了1个多小时。比赛后期,克泽们经常出现咬嘴唇抓头发等焦急的动作,观众们也开始紧张起来。结果只剩下十几分钟,败局已定的时候,柯洁仍然坚持完整的局面。

(比赛焦虑时的柯洁)

(馆长棋室人山人海,由专业围棋专家讲解。)

Alpha GO是DeepMind团队的DEMIS HASVIS、DaviD SILBA、黄思杰等开发的人工智能2016年3月,Alpha GO击败韩国棋手李世石5:3,成为第一个击败人类职业围棋选手的计算机程序。2016年12月末,Alpha GO穿着“大师”背心,在5天内横扫中日韩围棋界,最终以60连胜告退。

阅读这篇文章后,你会知道以下问题的答案。

年初不是过了PK吗?为什么又来了?

2)为什么AI一直盯着围棋?

Alpha GO到底是怎么下棋的?(最容易理解的版本说明)

4)被德福、围棋、国际象棋、AI入侵的下一个领域是什么?

5)Alpha go的技术有什么实际意义?

(10点30分开始第一只手)

第一,前面说

事实上,在与Kerjee Alpha Go的这场比赛开始之前,胜率并没有那么多人看好。柯吉本人在4月初的发布会上也使用了“带着必死的信念,不容易被打败”的悲壮话语。昨晚11:30在微博上发表了名为《最后的对决》的赛前感想。

“无论输赢,这都将是我与人工智能的最后三局对决。”

“目前的AI进步远远超出了我们的想象。国产绝艺、日产ZEN和AIphago虽然还有很大差距,但已经显示出强大的实力。”

“我相信未来属于人工智能。但是一直都是冷冰冰的机器。比起人类,我感受不到对围棋的热情和爱。”

这么重,这么伤心,很难想象是个曾经意气风发的天才少年。去年3月9日,李世多1:4失去Alpha GO时,19岁的他在微博上发表了——“Apha GAY赢了ISTOL也赢不了我”的豪言。他在KJ某处被神圣地吃瓜群众嘲笑后,立刻被刷世界冠军履历、翻脸的情节浸透了。国内大众一直偏爱柯洁,我们都喜欢听传说,看到任性的少年天才,打破陈规,扬名立万,起点网文一样的人生赢家。

这次战斗中败北,真是令人唏嘘。

第二,年初不是PK过了吗?为什么又来了?

事实上,这不是KJE与ALPA GO的第一场战斗。

2016年12月末,穿着大师背心的神秘骑士突然出现,在5天内横扫了中日韩围棋界。包括当时只有19年的第三次世界大战冠军柯泽久(今年20岁)、韩国等级第一的朴正焕9段、中国名人赛冠军连笑7段等,刺激了业界64岁的泰斗内卫平

已经PK过了,为什么还要再做一次?

本来年末,大师和各位围棋下面有一盘快30秒的围棋,对于拥有强大计算能力的计算机来说,优势明显。(威廉莎士比亚,温斯顿,计算机名言)(William Shinston,计算机名言)这次Kerjey vs Alpha GO是一盘缓慢的围棋,有3个小时的思考时间,对人类有利。

另一方面,这次与KAJE ALAPLA GO的“三番棋”不分胜负,将进行三局,接下来的第二轮比赛将分别于本周四(25日)和本周六(27日)在同一时间进行,比赛也将设立150万美元奖金。

三、为什么AI一直盯着围棋?

很多人对下阿尔法狗围棋的套路有误解。你以为是程序嘛。用最简单(最暴力)的方法玩——宫记自然是最有效的。

另外,不,不。但是首先,让我们计算一下绝境会发生多少事。

普林斯顿研究人员在标准围棋棋盘的情况下,共有1919=361个位置,每个位置有黑子、白瓷、空白、3种情况。所以一盘围棋理论上有3,361种可能性。但是,根据围棋规则,并非所有位置都能合法落子,因此,消除所有非法围棋后,正确的合法围棋数为——

.

你真的想知道吗?

深呼吸.

.

20816819938197998469947863348627702865224538845305484256394568209274196127380451698519643907259916008988314427129736203977

让我们把一台电脑暴力算法逼上绝路吧。也不是不行。普林斯顿研究人员发现,使用15TB硬盘空间、8-16核处理器和192GB内存的服务器将大约2.08 10 170围棋全部去掉,需要几个月的时间。如果按3个月计算,Alpha GO按照这个配置,每下一盘围棋,所有情况都做一遍,那么,到本盘围棋结束的时候,今年20多岁的KJE已经是60多岁的老人了。

第四,Alpha GO到底是怎么下棋的?(最容易理解的版本说明)

当然,上面的比喻有一些偷换概念,Alpha GO的构成比这个高得多。当年玩李世石围棋时,Alpha GO配备了1920个CPU和280个GPU,现在经过一年多的软硬件升级,自然将计算能力武装到牙齿上。

但是alpha go真的不是贫穷,而是深度学习(Deep Learning)和强化学习(Reinforcement Learning)相结合的系统。DeepMind团队在《自然》杂志上发表的《用深度神经网络和树搜索掌握围棋博弈(Mastering the Game of Go with Deep Neural Networks and Tree Search)》论文中详细说明了Alpha Go是如何下棋的,这里就不说了,只介绍粗制滥造的程序。

1)分析了专业棋谱,得到了两个结果:快速围棋战略(Rollout Policy)和战略网络(SL Policy Network)。其中,快速围棋战略类似于人们通过观察板面获得的“直觉”,使用线性模型训练。战略网络经过深度学习模式训练,进行类似人类“深思熟虑”的分析。

2)新的战略网络,与以前训练过的战略网络相辅相成,利用改进后的学习修改参数,最终获得改进后的战略网络(RL Policy Network),这类似于人类左右相互争斗后得到“进一步深思熟虑”的结果,判断某一局围棋的好坏。

3)将所有结果组成一个价值网(Value Network),对整个板块进行“全局分析”

4)综合评价“直觉”、“深思熟虑”、“全局分析”的结果,循环并找出最佳的落子点。

微软亚洲研究院主管研究员郑宇及微软亚洲研究院副研究员张均波在多篇论文中阅读原文,收集了很多其他资料后,一起完成了更详细的阿尔法狗原理流程图。这里转载说明,著作权归两位作者所有。

第五,德炮、围棋、象棋、下一个AI入侵领域是什么?

alpha go的“高”在英语中是“围棋”的意思。alpha go顾名思义,是专门为围棋制作的程序。但是DeepMind队在下一阶段转移目标,挑战暴雪的即时战略游戏《星际争霸》,再次意气风发的话,星际高手们请做好心理准备。下一个挑战可能发生在人族、神族、虫族的世界里。

事实上,2013年,DeepMind在NIPS上发表了名为《用深度增强学习玩Arari游戏(Playing Atari with Deep Reinforcement Learning)》的论文,使机器可以像人类一样玩Atari游戏。也就是说,只接受屏幕像素输入,只产生电子游戏控制器的压力信号,也可以说是喜欢玩游戏的AI团队。(莎士比亚)(美国电视剧《Northern Exposure》)。

事实上,自从第一台计算机出现以来,人们一直在不断努力编写更强大、更高效的计算机程序,希望计算机有朝一日能战胜人类。在过去的二十多年里,多次人机大战给人们留下了深刻的印象。

1997年5月,IBM的“深蓝”超级计算机以2胜1负3平的成绩战胜了当时的世界象棋大师冠军——卡斯帕罗夫(1997年5月)。事实上,从今天来看,“深蓝色”还不够智能。主要依靠强大的计算能力,计算所有道路的数量,选择最佳策略。(威廉莎士比亚、《哈姆雷特》、《真蓝》)当时“深蓝”每秒可计算2亿步,在全球超级计算机中排名第259位。

在比赛中两局完败,卡斯帕罗夫遭受了沉重的打击,他的斗志和体力在随后的三局中崩溃了。据说在决赛中,只有19个阶段宣布放弃。IBM拒绝了卡斯帕罗夫的再战请求,分解了“深蓝”,因此卡斯帕罗夫后来与电脑进行了多次战争,但再也找不到深蓝色的复仇。

2011年,“深蓝”等IBM的人工智能计划“沃森”在美国老兵智力竞赛节目《危险边缘》上挑战了两位人类冠军。沃森存储了2亿页的数据,包括各种百科全书、新闻、词典、文学书籍等,根据比赛奖金数额、局面的领先或落后情况以及自己是否熟悉这一领域的问题,可以判断自己应该回答哪些问题。最终沃森轻松地赢得了两个人类冠军。

1月20日,在《最强大脑》人机战争第三场比赛中,百度的大脑2比0轻松战胜了人类选手王浩宁。在这场比赛中,百度的大脑和“水刑”王皇较量的仍然是视频识别。在夜幕下,通过分别在行车记录仪、高层摄像头和手机上拍摄的模糊动态视频,双方需要记住3名不同识别对象的面部特征,并从节目现场的30人中识别出来。(大卫亚设)。

还有今年4月初由李开复发起的创新工厂、海南生态软件院共同主办的“冷浦大使”和“龙之队”德州扑克人机大战。

“冷大师”的前身来自耐克梅隆大学(CMU)Tuomas Sandholm教授开发的扑克计划Libratus。1月30日,Libratus在德州扑克比赛中以1比1击败了4名最高人类高手,在20天的日程中比了12万人,赢得了接近总数的筹码。人类队由6名中国人最高扑克选手组成,队长杜悦在世界德州扑克大赛WSOP的无限州德州扑克大赛中获得冠军。

最终,比赛以冷锋大师完胜人类的结局。李开复在比赛后也断言:“人工智能从完美信息的alpha go扩展到了不完美信息的冷大师。”人机大战基本上没有悬念。据说,Alpha GO最近将与中国进行KEJ大战,但实际上已经没有科学意义了。" "

第六,Alpha GO的技术有什么实际意义?

事实上,alpha go不是DeepMind唯一的项目,也不是最大的项目。DeepMind的最终目标是智能助手、医疗、机器人等。Scott Beaumont在4月初的发布会上表示,Alpha GO只是一个用于围棋的系统,但其原理可以应用于医疗中的癌症检查、机器人训练等实际问题。

与简单的深度学习应用不同,alpha go在系统中添加了强化学习部分。加强学习不一定会对机器设定特别明确的行为。机器探索性地行动后,观察“世界”会做出什么反应(奖励或惩罚),最终逐渐形成对刺激的期待,做出能获得最大利益的习惯性行动。这个方法具有普遍性,在其他很多领域都有研究,但阶段可能性较小,侧重于工作行为狭窄的领域,如围棋、简单物理运动等。英伟达CEO黄仁勋本月早些时候在GTC大会上宣布了ISAAC这个改进的学习世界模拟器,创造了一个完全虚拟的、专门为机器人训练而构建的世界,训练他打冰球、高尔夫球等。

结论:未来属于AI,但人类还没有结束

不管最后两局胜负如何,人工智能最终在围棋中战胜人类已经是可以预见的未来。即使这场三板旗比赛克泽最终获胜,也无法扭转这一潮流。也许明年,也许后年,但总有一天会有——。就像当年世界上最快的洋马宝马一样,最终赢不了车。

正如科泽所说:“我相信未来属于人工智能。”

但是alpha go的胜利是否意味着人类要完蛋了?别闹了,围棋不是我们生活的全部。人工智能也只是改善人类生产力的工具。对于许多科幻小说中提出的“颠覆人类”、“统治人类”的“超智能”,我们真的不用太担心。

(颜乐村)

“卷积神经网络之父”、深度学习三巨头之一、Facebook人工智能研究院院长Yann LeCun解释说,人类的占领、统治、斗争等大部分行为在一代进化过程中被“获取资源”的目的所驱动。而且,如果我们想让机器做一件事,就必须为此赋予制造机器的能力。(约翰f肯尼迪,机器名言)今天,我们已经在某些领域制造了比人类更聪明的机器,但人工智能并没有真正统治世界。因为我们不会为此而做。(比尔盖茨)。

火车刚发明的时候,美国一位权威人士预言说:“如果美国要建铁路,首先要建很多精神病院。因为如果人们看到呼啸而过的火车,他们会害怕的。”

德国专家表示:“如果火车超过每小时15英里,鲜血就会从乘客鼻腔喷出,造成死亡。”

1.《关于alphago柯洁我想说快讯!柯洁人机大战首战惜败 深度拆解AlphaGo套路》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《关于alphago柯洁我想说快讯!柯洁人机大战首战惜败 深度拆解AlphaGo套路》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/1953055.html