网易首页 > 网易号 > 正文 申请入驻

击败世界冠军、碾压两万玩家……OpenAI Five是什么来头?

0
分享至

近日,人工智能在游戏业界又搞出了一个“大新闻”:人工智能OpenAI Five在时下大火的竞技游戏“Dota2”里开设了竞技场擂台,玩家可以自行组建队伍去挑战它!这吸引了大量的主播和高玩组队挑战,但这个人工智能出乎意料的强大,在三天的测试期内,战绩为4409胜41负!

胜率99.1%,两个字:碾压。

就在上周,OpenAI Five还和2018国际Dota2邀请赛(TI8)冠军OG战队打了一场表演赛,2:0完胜。而一年前,OpenAI Five还只能和半职业的队伍打得有来有回。

这一年发生了什么?OpenAI Five又是怎么来的?这篇文章也许能给你答案。

OpenAI Five的起源

OpenAI Five的诞生,与“现实版钢铁侠”科技狂人马斯克有关。

2015年12月,马斯克与硅谷知名创业孵化器Y Combinator的总裁萨姆·奥尔特曼共同成立了非营利性AI技术研发组织OpenAI,并宣布将会以“推动AI技术造福人类”为己任,通过向社会无偿分享自己的AI技术,来规避由于科技巨头垄断AI技术而导致的潜在威胁因素。很快,这一组织就拿到了包括两位创始人在内的,共计超10亿美元的预期投资额。但三年之后,马斯克宣布辞任OpenAI董事会职务,这都是后话了。

(OpenAI成立,创始人们在学习机器上签名)

成立后不久,公司CTO Greg Brockman就为OpenAI设立了核心的技术研发方向:从强化学习(Reinforcement Learning)入手,最终实现无监督学习(UnsupervisedLearning)。

“强化学习”是机器学习领域的一个历史久远的技术分支,旨在让AI通过对未知环境的探索,来自行求得最优解。通过与深度学习相结合,这一技术能让AI快速掌握获取最优解的要领,我们所熟知的AlphaGo就是将“深度强化学习”运用到极致的佼佼者。

而“无监督学习”则更多的是指代一种在AI领域的通用概念,即:无需人工辅助对数据进行标记,即可自行理解数据含义并进行归纳总结的能力。从业内已公开的技术发展情况来看,目前研究还只能达到有效率地执行半监督学习(semi-supervised learning)阶段。

(OpenAI研发的智能机械手臂)

虽然在成立之初,OpenAI首席科学家Ilya Sutskever就曾明确表示过,OpenAI最核心的任务是发表有影响力的研究报告,但其实OpenAI更多的是在发力构建其开源开发平台。截至目前,OpenAI已经迭代推出了4款开源软件平台:

第一款名为Gym。这是一个用于研发和比较强化学习算法优劣的工具包,在2016年4月首次发布。开发者可以利用这一工具对自己开发的AI算法进行训练并展示,从而获得与其他平台开发者共同探讨和研究的机会;

第二款名为Universe。这是一个用于训练“解决通用问题的AI”的基础开发架构,在2016年12月首次发布。这一架构中包含了近千种AI训练环境,开发者可以利用这一工具将任何程序转换到Gym的环境下并进行训练。所以这款软件平台,也可以说是为Gym打开了一个万能的接口;

第三款名为Roboschool。这是一个用于模拟机器人控制训练的开源软件,在2017年5月首次发布。这一软件再度整合了Gym平台,可以视为是专门针对“机器人”这个应用领域单独开设的免费训练平台;

第四款名为Blocksparse。这是一个用于优化GPU神经网络运行效率的工具包,在2017年12月首次发布。这一软件主要是利用了数值分析中稀疏矩阵(Sparse matrix)的特性,通过减少不必要的运算量,来实现优化记忆神经网络的目的。

OpenAI Five的电竞缘分:无心插柳柳成荫

早在2016年,本来是用于机器人算法的OpenAI就瞄向了当时在Twitch上大火的竞技游戏Dota2,最关键的是该游戏本地支持Linux,且有可开源的API接口,这对于团队开发无疑是巨大的便利。

(热门竞技游戏Dota2)

OpenAI的首次亮相是在2017年的dota2国际邀请赛上(TI7)——Dota2乃至于整个电竞业最有影响力的赛事,OpenAI以娱乐赛的方式与当时的人气选手Dendi进行了一场1v1的单挑对决,最终结果是OpenAI战胜了Dendi。这为Dota2赛事带来了话题度,也让科技圈认识到OpenAI的技术进步。到2018年6月,OpenAI的能力已经扩大到完整的五人团队——OpenAI Five,并且可以击败业余和半职业玩家的队伍。又过去一年,就有了文章开头的那一幕。

(Dendi单挑OpenAI)

也有人会觉得,人工智能打游戏本来就有先天优势,那么OpenAI模拟Dota2难在哪里?

我们要先明确一件事,“人工智能”和“电脑玩家”是两个概念,后者只能遵循事先设定好的程序来行动,即使是新手,只要摸清了“电脑玩家”的行动模式,也能把对面玩的团团转,人工智能则不然。

Dota2是一款集操作与策略于一体的游戏,涉及对线、补刀、Gank、TP支援、团战等众多决策,而每一项决策又要对应非常复杂的操作。AI需要控制5名英雄,而每场游戏平均会产生80000帧的场景,要求AI具备很长的时间线、部分观察状态、高维连续动作空间和高维连续观察空间。

人们会不可避免地将OpenAI与AlphaGo作对比,实际上,国际象棋和围棋的棋盘分别是8x8和19x19,最多也就361个元素,而Open AI从运算数量和速度上来看都远远超过了下围棋的阿法狗。其训练模型也是最复杂的,它使用了256个V100 GPU和12800个CPU训练模型,每个网络都包含一个单层,每个单层又包含1024个单元的LSTM(长短记忆网络),通过dota2开发人员的API来提取当前游戏状态。

OpenAI的训练很特别,它80%的时间都在自我博弈,20%的时间在和旧版本对弈,折算成人类的训练时长,相当于180年,这也是它进步神速的原因之一。

AI在游戏里真的已经所向披靡了吗?

OpenAI Five的话题性,也引发了很多讨论,比如人工智能是否真的全面碾压了人类选手,这是否让电竞项目的观赏性开始打折扣?

其实,OpenAI Five这次的测试,还是有一定的局限性在。比如对战双方只能在17位英雄里选择,而不是正常dota2比赛的数百位英雄,并且有很多额外的规定,比如禁用道具。不少输给OpenAI Five的玩家也表示,和OpenAI Five对战的感觉并不像真实的dota2对战。总之,玩家想表达的就是OpenAI Five是赢在反应速度和人类无法完成的团队配合上,而不是策略。

(OpenAI团队与OG战队合影)

虽然OpenAI已经将系统的反应时间设定为0.2s(接近职业选手的反应),但是在错综复杂的团战中,每一次决策都保持在这个水准就是一件很恐怖的事情了。打个比方,足球比赛中,如果AI机器人在禁区某个区域的射门准确率达到100%,遵循最优解原则,AI一定是倾向于把球带向这个位置然后得分,那人类破解的办法就是破坏AI机器人在这个区域起脚的机会,但这种感觉显然与真实的对战差异很大。

所以也有玩家认为,OpenAI在游戏里给人的感觉像一个大型网游,而非真实的对手。那41次人类的胜利,正是人类玩家见招拆招的成果。事实也是如此,前仆后继的挑战者发现了AI的行为其实是有迹可循的,钻研出一套特别的阵容,特别的打法,最终获得胜利,说明OpenAI仍然有很大的提升空间。

近年来,人工智能和电竞游戏的结缘次数越来越多。比如,DeepMind旗下的阿尔法星,曾战胜过国际象棋冠军,它跨界登上了经典即时战略游戏《星际争霸2》的舞台,并在与人类的对战中取得压倒性胜利。在近日的高通人工智能开放日上,高通宣布将与vivo、腾讯一道联手打造《王者荣耀》AI电竞战队。

让人工智能打游戏绝非仅仅为了好玩和话题度,比尔盖茨就曾评论,Dota 2机器人展示了团队合作和协作,这将是未来发展的关键技能。据报道,OpenAI下一步将挑战更复杂的人机游戏。与人类在策略、判断领域的竞赛,恰恰是证明AI技术发展的一大舞台,以此为基础,人工智能会在其他领域衍生出更多的可能性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
林志颖捂了12年的kimi,首次公开正面照,网友:这脸,判若俩人……

林志颖捂了12年的kimi,首次公开正面照,网友:这脸,判若俩人……

可读
2026-06-25 23:21:52
杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

照见古今
2026-03-26 19:06:28
与“魔鬼”交易,意大利总理梅洛尼为保住执政,或与右翼政党结盟

与“魔鬼”交易,意大利总理梅洛尼为保住执政,或与右翼政党结盟

究竟谁主沉浮
2026-06-29 09:41:52
两名阿根廷网红持过期证件混入世界杯赛场,本想直播吸粉,被美国警方抓获,面临指控

两名阿根廷网红持过期证件混入世界杯赛场,本想直播吸粉,被美国警方抓获,面临指控

红星新闻
2026-06-29 14:20:42
大家提前做好准备,7月开始,不出意外的话,中国或将出现4大变化

大家提前做好准备,7月开始,不出意外的话,中国或将出现4大变化

次元君情感
2026-06-29 02:45:27
26年“下岗潮”来了?三大行业即将面临失业风险,早知道早准备

26年“下岗潮”来了?三大行业即将面临失业风险,早知道早准备

星娱叨叨社
2026-06-27 15:01:24
驴友夫妇痛骂国内医院,8天花1471元?3年后美国车祸花60余万美元

驴友夫妇痛骂国内医院,8天花1471元?3年后美国车祸花60余万美元

贱议你读史
2026-05-31 16:19:12
太惨了!福建海参厂老板被同学拉去赌球,输了2200万,烧炭自杀

太惨了!福建海参厂老板被同学拉去赌球,输了2200万,烧炭自杀

水晶的视界
2024-12-05 06:00:12
痛心!博主买光老农民的菜,还带其下馆子,分别后老人竟意外离世

痛心!博主买光老农民的菜,还带其下馆子,分别后老人竟意外离世

另子维爱读史
2026-06-29 21:29:23
专家再次预测:2027年房价走势,或大概率是对的!提前做好准备

专家再次预测:2027年房价走势,或大概率是对的!提前做好准备

猫叔东山再起
2026-06-29 10:35:04
原来他俩已离婚,如今一个在新加坡孤独终老,一个另娶她人秀恩爱

原来他俩已离婚,如今一个在新加坡孤独终老,一个另娶她人秀恩爱

胡一舸南游y
2026-06-29 21:17:22
糯康行刑前坦言毒贩不惧边防枪械,忌惮尘封三十年无人敢动的密令

糯康行刑前坦言毒贩不惧边防枪械,忌惮尘封三十年无人敢动的密令

唠叨说历史
2026-06-29 17:16:07
CPTPP准备接收菲律宾,中国更早申请加入,却仍被卡在第一步之外

CPTPP准备接收菲律宾,中国更早申请加入,却仍被卡在第一步之外

牛锅巴小钒
2026-06-28 15:36:45
桃子被发现!医生研究发现:吃得越多,高血脂患者血管或越干净?

桃子被发现!医生研究发现:吃得越多,高血脂患者血管或越干净?

岐黄传人孙大夫
2026-06-29 12:43:32
左权牺牲后:无人能当彭德怀的参谋长,最后从毛主席身边挖走一人

左权牺牲后:无人能当彭德怀的参谋长,最后从毛主席身边挖走一人

芊芊子吟
2026-06-29 23:45:05
妻子谈劳塔罗收获世界杯首球:我们一直都在等这一刻,非常激动

妻子谈劳塔罗收获世界杯首球:我们一直都在等这一刻,非常激动

懂球帝
2026-06-29 11:37:21
历史性一刻!乌鲁木齐到北京首开动车,29小时30分,票价曝光!

历史性一刻!乌鲁木齐到北京首开动车,29小时30分,票价曝光!

椰青美食分享
2026-06-28 14:42:38
一旦日本对中国动手,我国结束中日战斗需要几天?答案让日本绝望

一旦日本对中国动手,我国结束中日战斗需要几天?答案让日本绝望

素颜为谁倾城人
2026-06-28 22:56:29
Shams:勇士计划通过送走巴特勒换来戴维斯,中产签约詹姆斯

Shams:勇士计划通过送走巴特勒换来戴维斯,中产签约詹姆斯

爱体育
2026-06-29 22:47:58
又来一只半导体新股,22.6元明日申购值不值?

又来一只半导体新股,22.6元明日申购值不值?

固件更新中
2026-06-29 00:55:51
2026-06-30 01:20:49
AI趋势学院
AI趋势学院
最前沿的知识讨论地
21文章数 0关注度
往期回顾 全部

科技要闻

杀疯了!深圳一天出两家200亿具身智能公司

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

跟风电影《给阿公的牛肉丸》开机

财经要闻

万达广场批量易主 多位投资人正式入局

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

手机
时尚
旅游
本地
军事航空

手机要闻

OPPO Reno16新配色半夏青发布:3D悬浮幸运草设计 3499元起

杨紫,视后!

旅游要闻

“独角牛” 成团宠,影视 IP 为文旅注入 “牛” 动力

本地新闻

贵州小城的新目标:举办“村超”世界杯!

军事要闻

普京最新发声:俄罗斯正处于命运攸关之际

无障碍浏览 进入关怀版