鱼阳发源于凹陷的秘史。
量子比特报告|公众号QbitAI
如果让AI玩《2048》这样的游戏,会是怎么样的画面?
现在,有些人开始用强化学习的方法来实践。
于是,插上DQN的翅膀,AI从零起步,自己琢磨出了《2048》的玩法:
一起手,是不是就有内味了?
这操作,条理清晰到令人感到舒适。“1000,no;1024,yes”的强迫症们不禁纷纷点赞,给这只AI贡献了800+ reddit热度。
用DQN玩《2048》
调教出这只会玩《2048》的AI的,是一位巴西老哥Felipe Marcelino。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。
首先,他采用OpenAI Gym构建了自定义强化学习环境。
其中包括两种2048棋盘表示方式:
- 二进制——使用二次幂矩阵表示棋盘中的每一块区域
- 非二进制——原始数字矩阵
模型包含两种类型的神经网络:CNN和MLP(多层感知机)。
据Felipe介绍,与MLP相比,以CNN作为特征提取器的智能体表现得更好。
训完之后,老哥测试了一下,在1000把游戏中,AI有100次达到了2048。
玩《2048》的AI们
目前,这只用DQN训练出的AI玩到2048就打住了。
不过,巴西老哥抛砖,又吸引了不少来献玉的盆友。
比如,同样采用强化学习方法,将时序差分学习和最大期望搜索相结合的2048控制器。
在10步/秒的策略下,它最高能凑出32768。
而在追求高分的路上,有一位来自日本的选手表现亮眼。
依靠7个卷积层的深度卷积网络,这只在《2048》这个游戏中最高拿到了401912分。
正如一位网友所说:这正是一个足够有趣,又不太复杂的强化学习案例。
如果你是刚刚开始学习强化学习,也不妨拿这个小项目练练手~
参考链接
《2048》相关开源项目:
相关论文:
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
1.《你玩《2048》能拿多少分?AI的最高分纪录:401912》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《你玩《2048》能拿多少分?AI的最高分纪录:401912》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/2245254.html