网易首页 > 网易科技 > 网易科技 > 正文

Google DeepMind团队在《自然》杂志发表论文,公布玩游戏比人厉害的AI是如何做出来的

0
分享至


电脑会玩游戏已经不算稀奇,比方说,一般人玩棋类游戏已经玩不过计算机了。但如果事先不告诉计算机应该怎么玩,而只是给它提供这三样东西:控制器、显示器、游戏得分,让它看着显示器的显示控制控制器,然后要求它尽可能得高分,那基本上大部分的AI就一筹莫展了。

所以,当2013年12月DeepMind的团队首次展现他们靠不断试错学习最后成为击败人类专业玩家的游戏高手AI时,许多在场的AI专家都感到有些震惊。这些AI靠着对游戏视频的观察来寻找出模式,然后操作控制器,并获得得分的反馈结果(高分奖励)。在反馈中不断调整自己的控制,最后AI完全靠自学而不是编码学会了玩49种Atari视频游戏,其中43种游戏玩得比之前的AI都要好;并在23种游戏中击败了人类的职业玩家。这些游戏当中,简单的弹球和拳击游戏AI玩得最好,但是像经典的消砖块Breakout游戏也能玩得很好,甚至还学会了打开一条通道让球跑到后面去消掉砖块(参见下面视频,注意观察AI如何在游戏中改进自己的策略),这种技巧往往只有老练的玩家才会。许多研究人员1年后对他们如何做到仍感到困惑不已。不过现在他们不用困惑了,因为DeepMind团队现在已经在《自然》杂志上公布了自己的研究成果:Human-level control through deep reinforcement learning—通过深度强化学习实现人类水平的控制。

总的说来,DeepMind的AI的设计核心是如何让计算机自行发现数据中存在的模式。其解决方案是深度神经网络与强化学习等方法的的结合。AI并并不知道游戏规则,而是用深度神经网络来了解游戏的状态,找出哪一种行为能导致得分最高。尽管利用模拟神经网络来教电脑玩游戏(如军棋游戏)的方法已经使用了几十年,但是从未有人能像DeepMind团队那样以如此有用的方式结合到一起,智能系统普朗克学院的Bernhard Sch lkopf主任称,其方案展现出了令人印象深刻的可适应性。

这一方面是得益于现在计算能力的提高使得AI可处理规模要大得多的数据集,要知道,观察Atari游戏相当于每秒处理200万像素的数据。另一方面则是得益于DeepMind结合了强化学习来训练AI,而且是在高维度感觉输入中采用的端到端强化学习。相对于以往计算机会玩的游戏,如国际象棋等,这次计算机玩的游戏更接近现实世界的混沌状态。Google的智能设计师Demis Hassabis称,这是第一种能在一系列复杂任务当中与人类表现相当的算法。

那么Google会不会用这种AI来分析自己的大规模数据集呢?Hassabis并没有给出任何肯定的说法,但称该系统对任何连续性决策任务都有用。如果我们把Google收集的用户数据比作像素,把广告收入比作得分的话,DeepMind的AI系统一样也可以用在比如Google的核心广告业务。让AI去置放的广告,点击率越高就给它更高的分数,这样AI能够不断演进优化广告的投放算法。而伦敦大学金斯密斯学院的Michael Cook甚至给出了确切的数字,称Google已经在7款产品中采用了DeepMind的技术。其中会不会包括Google研发的自动汽车呢?也许用不了多久我们就能感受到有了那颗DeepMind支撑的产品的表现差异了。

[消息来源:nature.com, newscientist.com, theverge.com]

相关推荐
热点推荐
通道突然消失!上海一地铁站改造引吐槽:700多米绕路13分钟,阻断两个商场…

通道突然消失!上海一地铁站改造引吐槽:700多米绕路13分钟,阻断两个商场…

上观新闻
2024-04-28 10:47:45
A股:4个消息来了,A股或将重演19年历史?

A股:4个消息来了,A股或将重演19年历史?

逆潮流财商
2024-04-29 04:00:03
世界乒联晒出新榜单,孙颖莎第五,伊藤美诚第二,头名实至名归

世界乒联晒出新榜单,孙颖莎第五,伊藤美诚第二,头名实至名归

北丐聊球
2024-04-28 15:02:26
我是工地单身女人,临时丈夫待我太好了

我是工地单身女人,临时丈夫待我太好了

马军情感故事
2024-04-04 23:39:46
英特尔、高通、英伟达集体官宣,准备脱钩了?人民日报:认清现状

英特尔、高通、英伟达集体官宣,准备脱钩了?人民日报:认清现状

搞笑的阿票
2024-04-28 16:51:19
雷军被李想锁车里?小米高管回应!雷军:我真是社恐,有点紧张

雷军被李想锁车里?小米高管回应!雷军:我真是社恐,有点紧张

北京商报
2024-04-27 17:12:39
医学院是他的后花园,329名情人刷新医学界纪录!

医学院是他的后花园,329名情人刷新医学界纪录!

七月故事会
2024-04-26 11:02:02
38秒28,中国接力男队夺得佛罗里达东海岸接力赛男子4X100米冠军

38秒28,中国接力男队夺得佛罗里达东海岸接力赛男子4X100米冠军

直播吧
2024-04-28 09:11:33
辽宁队决战广东队,12人大名单揭晓,杨鸣派最强阵容,横扫广东

辽宁队决战广东队,12人大名单揭晓,杨鸣派最强阵容,横扫广东

宗介说体育
2024-04-28 18:02:55
私人影院提供特色观影服务?我试图前往体验,却发现掉入桃色陷阱

私人影院提供特色观影服务?我试图前往体验,却发现掉入桃色陷阱

亲爱的落落
2024-04-15 10:57:58
两大名帅来投!切尔西时来运转,高层开三年合同,穆里尼奥笑了

两大名帅来投!切尔西时来运转,高层开三年合同,穆里尼奥笑了

祥谈体育
2024-04-28 20:25:02
大反转!纪云浩职业经历被老战友夸赞,大学学历与转业有新解释

大反转!纪云浩职业经历被老战友夸赞,大学学历与转业有新解释

李昕言温度空间
2024-04-26 13:51:11
湖人的G4,尽人事得到了回报

湖人的G4,尽人事得到了回报

静易墨
2024-04-28 18:15:37
河北省纪委监委公开通报!唐山1名干部被处分!

河北省纪委监委公开通报!唐山1名干部被处分!

唐山你好
2024-04-29 00:04:33
彭于晏遛狗被偶遇,满脸沧桑,脖子处贴着膏药,42岁仍孑然一身

彭于晏遛狗被偶遇,满脸沧桑,脖子处贴着膏药,42岁仍孑然一身

娱小小新
2024-04-28 16:01:04
上海婆婆“反洗房”新招:增加2个步骤,小两口离婚分不走半套房

上海婆婆“反洗房”新招:增加2个步骤,小两口离婚分不走半套房

今天不开心
2024-04-28 16:35:44
意外!37岁中超“亿元先生”将复出,有望加盟中甲劲旅,率队冲超

意外!37岁中超“亿元先生”将复出,有望加盟中甲劲旅,率队冲超

体坛春秋
2024-04-29 04:20:58
“中美”达成了共识!4月28日,深夜的三大重要消息冲击来袭!

“中美”达成了共识!4月28日,深夜的三大重要消息冲击来袭!

风口招财猪
2024-04-28 09:02:05
恩比德系列赛至今末节合计18中3 今天5中0得到1分1板

恩比德系列赛至今末节合计18中3 今天5中0得到1分1板

直播吧
2024-04-29 04:33:03
感受俄语魅力:俄罗斯全民听写大赛在京举行

感受俄语魅力:俄罗斯全民听写大赛在京举行

俄罗斯卫星通讯社
2024-04-28 16:29:39
2024-04-29 05:16:49

科技要闻

特斯拉生死时速,马斯克西天取经

头条要闻

警方通报女子在卫生间被打:4人被行拘13日罚款1千元

头条要闻

警方通报女子在卫生间被打:4人被行拘13日罚款1千元

体育要闻

湖人的G4,尽人事得到了回报

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

上财万字报告深度解读Q1经济

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

家居
艺术
健康
教育
旅游

家居要闻

光影之间 空间暖意打造生活律动

艺术要闻

共度北京108小时 北京当代2024“凝聚”全球36座城市100余家艺术机构

春天野菜不知不识莫乱吃

教育要闻

三年级二班最近新调来一位数学老师,脑子里面竟是些稀奇古怪的题

旅游要闻

年轻人出游:为了爱好说走就走 好玩不贵很重要

无障碍浏览 进入关怀版
×