要砸1000亿！米哈游准备认真做AI|沙盒|游戏|虚幻引擎|steam

要砸1000亿！米哈游准备认真做AI

2026-05-16 17:11:36　来源: 游戏日报

北京举报

分享至

成为全球游戏行业最具影响力的价值连接者

5月15日，米哈游于北京举办AI大模型技术分享会暨顶尖校招宣讲，以非公开形式面向高校顶尖人才与技术圈核心人士，官宣千亿级AI投入与全栈自研路线，标志米哈游发展战略将朝向AI驱动科技企业进一步押注。

在本次分享会中，米哈游联合创始人刘伟（大伟哥）也登台分享了自己对于AI业务的愿景，并抛出了一个颇为震撼的数字：未来三年，最多投入1000亿元以深耕AI领域。他坦言，“就算最终不成功，没做出来，也认了，就当放一场大烟花。”这份决绝，彰显出米哈游深耕AI领域的坚定决心。

战略层面不搞“大公司病”

在本次分享会中，大伟哥首先提到：“公司的创始人也必须是技术负责人，必须在一线做所有的事情，只有这种方式才能将大模型做成。”

当今时代下，AI大模型范式迭代极快，决策层若脱离了技术一线，只靠汇报来做决策，高昂的管理成本不仅会拖垮团队，更会让企业被时代淘汰。因此，最高决策者必须扎根在代码与训练曲线一线，只有这样才能守住极致的技术敏锐度。

事实上，米哈游早已践行这一理念。在游戏日报此前关于刘伟在上海交通大学演讲的报道中便提及，联合创始人蔡浩宇无论公司规模如何扩张，始终坚守技术一线；在AI大模型时代来临后，他义无反顾的把米哈游所有东西都抛在身后，从零开始学习钻研。最近Agent技术十分火热，蔡浩宇也会亲手搭建Agent，即便每日睡眠不足五六小时也始终保持极高的研发热情。

另外，组建团队做AI需要警惕“大牛陷阱”，坚持扁平化优先。大伟哥提到，“我们不希望招一个大牛。大牛有自己很强的ego（自我），有自己的scope（负责内容）......但只有一个年轻的、志同道合的团队，才有可能真正实现弯道超车。”

这其实指出，传统AI经验在LLM时代反而可能成为“负资产”，影响项目的推进。一些固守局部优化，执着于“守边界”、“抢地盘”的资深管理者，往往有强烈的自我意识，但这会扼杀全局视角的创新。在今天，从数据、模型到Infra，真正能实现突破的，是志同道合、扁平化的年轻团队，而非沉迷于个人Scope的“大牛”。

此外，在研发效率层面，大伟哥还提出了“AI for AI，Model with Model”的核心逻辑，让AI进入自主研发循环。真正的效率提升并非盲目扩招，而是让大模型自主分析训练瓶颈、编写复杂的GPU内核代码、定位程序漏洞。谁能率先搭建“自动调优沙盒”，谁就能在迭代速度上实现降维打击。

技术层面的“薪火”

除了在公司战略层面，游戏日报也整理了大伟哥在前沿技术层面的一些洞见。

在基建层面，米哈游重新定义了AI Infra的价值边界，大伟哥指出，模型能力的上限正由基础设施重新界定。在万卡规模下，通信、计算、数据的协同设计早已不是简单的“底层修管道”，而是直接决定算法模型能跑多大参数、支撑多长的Context。系统工程的核心，就是在正确性与极致性能之间找到最优解。

而在AI预训练环节，米哈游强调数据与工程的关系博弈。大伟哥认为，数据是要占据0~90分的量级，模型则是做90~95分的突破。在此前提下，数据清洗、去重与配比决定了模型的基础，小规模训练下看似有效的模型Trick，在极限Scale下往往会失效，唯有优质的数据分布才能带来稳定收益。

同时，大规模训练的本质是消灭“小概率事件”，要把小概率事件变成一个确定性的工程，不然的话，“一个简单的Loss Spike（损失值异常飙升）会导致整个模型去疯。”

即便是在单卡上无足轻重的Token异常、算子Bug，看起来可能毫无波澜，但在万卡集群中则会被无限放大，直接导致模型的灾难性崩溃。因此，拥有从梯度到底层算子的全链路可观测能力，是预训练保持稳定、不被“炸毁”的唯一保障。

在后训练与多模态领域，米哈游则提出了通往AGI的真实路径，提出智能的终极公式是“Context × Permission”，单纯喂长文本，或给一个没有环境的Function Call都毫无意义，真正的Agent需要让模型读取真实世界的上下文（如代码库、聊天记录），并拥有执行修改的权限，二者相乘才是智能的上限。

而在强化学习方面，米哈游认为简单采用RLHF（人类反馈强化学习）已不是未来方向，下一代RL（强化学习）需要让模型在真实交互环境中试错，以“修改代码导致pipeline崩溃”这类真实代价作为Reward信号，解决长周期任务的学分分配问题。

未来的多模态也要摒弃简单的“语音转文字+文字转语音”的外挂式流水线，而是在预训练早期就将音频等模态特征融入基座，让模型拥有原生物理感知能力的同时，保留其强大的逻辑推理内核。

米哈游的野望

综合游戏日报之前的报道，不难发现米哈游近日在AI领域动作频频。

米哈游创始人蔡浩宇在硅谷的AI创业公司Anuttacon刚经历了一次重大的战略转向。公司最初的目标是利用AI技术（包括大语言模型、语音、视频）打造“像人”的互动系统，并发布了一款实验性AI对话游戏《Whispers from the Star》进行验证。

如今，这款游戏在Steam平台的评分定位在特别好评（82%好评率），即便整体上得到认可，同时也有不少玩家反馈AI模型还不够智能，未能完全实现玩法概念目标。

而最近，公司停止了多模态表演模型等原有方向的研发，将几乎全部算力和核心团队都集中投入到通用大语言模型（LLM）和智能体Agent的构建上，LLM相关团队整体回流国内，进入集中作战状态，蔡浩宇也将研发重心从美国转移回了中国。

在前不久的大伟哥交大演讲中，AI也是高频出现的词汇。大伟哥指出，人工智能的应用与影响已实现阶段性跃迁，其范围远超早期的聊天对话（Chatbot）功能，如今已进入能够自主规划、使用工具并执行复杂任务的“智能体”（Agent）阶段。当前，智能体已能深度参与大部分非图形界面的软件工程，成为开发者的强大协作者。

在游戏产业，这种变革尤为显著，其影响是双重的。一方面，在游戏制作端，AI正作为“超级辅助”渗透到美术、叙事、设计、编程等全流程，极大地提升效率并降低创作门槛。另一方面，在游戏体验端，更具颠覆性的未来正在临近：预计未来两三年内，AI将实现“千人千面”的个性化游戏体验，能够为每位玩家实时生成独一无二的剧情、任务和玩法，使游戏从固定剧本进化为动态世界。

在这种技术背景下，人类与AI的协作关系正在被重新定义。在当前阶段，AI的核心角色是高效的“解题者”，擅长在人类设定的框架内执行任务、生成内容。而人类不可替代的独特优势，则在于成为“出题者”——即拥有定义问题、设定愿景和探索未知的能力。

而最近，米哈游AI技术已实现部分落地——通过自然语言交互，帕姆AI能够主动理解并满足玩家需求，不仅可以用它查询攻略（如角色养成、配队建议），还可以与扮演列车长帕姆的AI进行趣味互动，其回复符合角色设定，体验自然。

在技术层面，为应对千万级玩家的高并发挑战，米哈游采用了多模块协同系统、将逻辑推理嵌入模型权重以提升响应速度、应用FP8混合精度训练以降低成本。同时，通过深度定制化训练将游戏世界观“刻入”模型基因，并采用知识库与模型能力层分离的架构，使两者能独立优化，并让模型具备基于反馈的在线强化学习能力，持续进化。

“帕姆帮帮”作为米哈游AI技术进入实际应用阶段的标志，尽管目前作为“测试版”尚有改进空间，但其底层架构具备通用性，可扩展至其他NPC，就在此前，米哈游已构想过如“星穹狼人杀”等AI驱动的新玩法，让AI角色拥有自主行为与策略。这标志着游戏交互方式从传统UI向自然语言的变革，AI正从开发工具转变为游戏体验的核心组成部分，目前也收获了良好的口碑。

同样的，AI NPC系统也在不久前开启二测的《星布谷地》中得到了应用。以咖啡店老板娘“娜洛”为例，其具备长线记忆功能、个性化的情感反应和拟人化的高自由度对话能力，旨在与玩家建立深度的情感连接，从而构成游戏的核心差异化竞争力。即便有时回应略显刻板，但也仍展现出了一定的逻辑反应潜力。

从战略启航到阶段成果落地，米哈游AI事业的版图已然越来越清晰。从短期看，AI是革新游戏生产方式、重构玩家交互体验的核心工具；从长期看，集中攻坚通用AI与智能体，是米哈游布局下一代数字内容、探索AI原生数字世界的关键一步。随着技术持续迭代与团队整合完成，这场由米哈游主导的游戏AI革命，或将持续释放更大的产业能量。

看见趋势，读懂行业，立即加入

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.