成为全球游戏行业最具影响力的价值连接者
5月15日,米哈游于北京举办AI大模型技术分享会暨顶尖校招宣讲,以非公开形式面向高校顶尖人才与技术圈核心人士,官宣千亿级AI投入与全栈自研路线,标志米哈游发展战略将朝向AI驱动科技企业进一步押注。
![]()
在本次分享会中,米哈游联合创始人刘伟(大伟哥)也登台分享了自己对于AI业务的愿景,并抛出了一个颇为震撼的数字:未来三年,最多投入1000亿元以深耕AI领域。他坦言,“就算最终不成功,没做出来,也认了,就当放一场大烟花。”这份决绝,彰显出米哈游深耕AI领域的坚定决心。
战略层面不搞“大公司病”
在本次分享会中,大伟哥首先提到:“公司的创始人也必须是技术负责人,必须在一线做所有的事情,只有这种方式才能将大模型做成。”
当今时代下,AI大模型范式迭代极快,决策层若脱离了技术一线,只靠汇报来做决策,高昂的管理成本不仅会拖垮团队,更会让企业被时代淘汰。因此,最高决策者必须扎根在代码与训练曲线一线,只有这样才能守住极致的技术敏锐度。
事实上,米哈游早已践行这一理念。在游戏日报此前关于刘伟在上海交通大学演讲的报道中便提及,联合创始人蔡浩宇无论公司规模如何扩张,始终坚守技术一线;在AI大模型时代来临后,他义无反顾的把米哈游所有东西都抛在身后,从零开始学习钻研。最近Agent技术十分火热,蔡浩宇也会亲手搭建Agent,即便每日睡眠不足五六小时也始终保持极高的研发热情。
另外,组建团队做AI需要警惕“大牛陷阱”,坚持扁平化优先。大伟哥提到,“我们不希望招一个大牛。大牛有自己很强的ego(自我),有自己的scope(负责内容)......但只有一个年轻的、志同道合的团队,才有可能真正实现弯道超车。”
这其实指出,传统AI经验在LLM时代反而可能成为“负资产”,影响项目的推进。一些固守局部优化,执着于“守边界”、“抢地盘”的资深管理者,往往有强烈的自我意识,但这会扼杀全局视角的创新。在今天,从数据、模型到Infra,真正能实现突破的,是志同道合、扁平化的年轻团队,而非沉迷于个人Scope的“大牛”。
此外,在研发效率层面,大伟哥还提出了“AI for AI,Model with Model”的核心逻辑,让AI进入自主研发循环。真正的效率提升并非盲目扩招,而是让大模型自主分析训练瓶颈、编写复杂的GPU内核代码、定位程序漏洞。谁能率先搭建“自动调优沙盒”,谁就能在迭代速度上实现降维打击。
技术层面的“薪火”
除了在公司战略层面,游戏日报也整理了大伟哥在前沿技术层面的一些洞见。
在基建层面,米哈游重新定义了AI Infra的价值边界,大伟哥指出,模型能力的上限正由基础设施重新界定。在万卡规模下,通信、计算、数据的协同设计早已不是简单的“底层修管道”,而是直接决定算法模型能跑多大参数、支撑多长的Context。系统工程的核心,就是在正确性与极致性能之间找到最优解。
而在AI预训练环节,米哈游强调数据与工程的关系博弈。大伟哥认为,数据是要占据0~90分的量级,模型则是做90~95分的突破。在此前提下,数据清洗、去重与配比决定了模型的基础,小规模训练下看似有效的模型Trick,在极限Scale下往往会失效,唯有优质的数据分布才能带来稳定收益。
同时,大规模训练的本质是消灭“小概率事件”,要把小概率事件变成一个确定性的工程,不然的话,“一个简单的Loss Spike(损失值异常飙升)会导致整个模型去疯。”
即便是在单卡上无足轻重的Token异常、算子Bug,看起来可能毫无波澜,但在万卡集群中则会被无限放大,直接导致模型的灾难性崩溃。因此,拥有从梯度到底层算子的全链路可观测能力,是预训练保持稳定、不被“炸毁”的唯一保障。
在后训练与多模态领域,米哈游则提出了通往AGI的真实路径,提出智能的终极公式是“Context × Permission”,单纯喂长文本,或给一个没有环境的Function Call都毫无意义,真正的Agent需要让模型读取真实世界的上下文(如代码库、聊天记录),并拥有执行修改的权限,二者相乘才是智能的上限。
而在强化学习方面,米哈游认为简单采用RLHF(人类反馈强化学习)已不是未来方向,下一代RL(强化学习)需要让模型在真实交互环境中试错,以“修改代码导致pipeline崩溃”这类真实代价作为Reward信号,解决长周期任务的学分分配问题。
未来的多模态也要摒弃简单的“语音转文字+文字转语音”的外挂式流水线,而是在预训练早期就将音频等模态特征融入基座,让模型拥有原生物理感知能力的同时,保留其强大的逻辑推理内核。
米哈游的野望
综合游戏日报之前的报道,不难发现米哈游近日在AI领域动作频频。
米哈游创始人蔡浩宇在硅谷的AI创业公司Anuttacon刚经历了一次重大的战略转向。公司最初的目标是利用AI技术(包括大语言模型、语音、视频)打造“像人”的互动系统,并发布了一款实验性AI对话游戏《Whispers from the Star》进行验证。
如今,这款游戏在Steam平台的评分定位在特别好评(82%好评率),即便整体上得到认可,同时也有不少玩家反馈AI模型还不够智能,未能完全实现玩法概念目标。
![]()
而最近,公司停止了多模态表演模型等原有方向的研发,将几乎全部算力和核心团队都集中投入到通用大语言模型(LLM)和智能体Agent的构建上,LLM相关团队整体回流国内,进入集中作战状态,蔡浩宇也将研发重心从美国转移回了中国。
在前不久的大伟哥交大演讲中,AI也是高频出现的词汇。大伟哥指出,人工智能的应用与影响已实现阶段性跃迁,其范围远超早期的聊天对话(Chatbot)功能,如今已进入能够自主规划、使用工具并执行复杂任务的“智能体”(Agent)阶段。当前,智能体已能深度参与大部分非图形界面的软件工程,成为开发者的强大协作者。
![]()
在游戏产业,这种变革尤为显著,其影响是双重的。一方面,在游戏制作端,AI正作为“超级辅助”渗透到美术、叙事、设计、编程等全流程,极大地提升效率并降低创作门槛。另一方面,在游戏体验端,更具颠覆性的未来正在临近:预计未来两三年内,AI将实现“千人千面”的个性化游戏体验,能够为每位玩家实时生成独一无二的剧情、任务和玩法,使游戏从固定剧本进化为动态世界。
在这种技术背景下,人类与AI的协作关系正在被重新定义。在当前阶段,AI的核心角色是高效的“解题者”,擅长在人类设定的框架内执行任务、生成内容。而人类不可替代的独特优势,则在于成为“出题者”——即拥有定义问题、设定愿景和探索未知的能力。
而最近,米哈游AI技术已实现部分落地——通过自然语言交互,帕姆AI能够主动理解并满足玩家需求,不仅可以用它查询攻略(如角色养成、配队建议),还可以与扮演列车长帕姆的AI进行趣味互动,其回复符合角色设定,体验自然。
![]()
在技术层面,为应对千万级玩家的高并发挑战,米哈游采用了多模块协同系统、将逻辑推理嵌入模型权重以提升响应速度、应用FP8混合精度训练以降低成本。同时,通过深度定制化训练将游戏世界观“刻入”模型基因,并采用知识库与模型能力层分离的架构,使两者能独立优化,并让模型具备基于反馈的在线强化学习能力,持续进化。
“帕姆帮帮”作为米哈游AI技术进入实际应用阶段的标志,尽管目前作为“测试版”尚有改进空间,但其底层架构具备通用性,可扩展至其他NPC,就在此前,米哈游已构想过如“星穹狼人杀”等AI驱动的新玩法,让AI角色拥有自主行为与策略。这标志着游戏交互方式从传统UI向自然语言的变革,AI正从开发工具转变为游戏体验的核心组成部分,目前也收获了良好的口碑。
同样的,AI NPC系统也在不久前开启二测的《星布谷地》中得到了应用。以咖啡店老板娘“娜洛”为例,其具备长线记忆功能、个性化的情感反应和拟人化的高自由度对话能力,旨在与玩家建立深度的情感连接,从而构成游戏的核心差异化竞争力。即便有时回应略显刻板,但也仍展现出了一定的逻辑反应潜力。
![]()
从战略启航到阶段成果落地,米哈游AI事业的版图已然越来越清晰。从短期看,AI是革新游戏生产方式、重构玩家交互体验的核心工具;从长期看,集中攻坚通用AI与智能体,是米哈游布局下一代数字内容、探索AI原生数字世界的关键一步。随着技术持续迭代与团队整合完成,这场由米哈游主导的游戏AI革命,或将持续释放更大的产业能量。
看见趋势,读懂行业,立即加入
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.