来源:环球网
【环球网科技报道 记者 李文瑶】2026中关村论坛年会于3月25日在北京开幕,本届年会以“科技创新与产业创新深度融合”为主题,汇聚全球顶尖科学家与产业领袖共话未来。
在开幕式主旨演讲中,月之暗面Kimi创始人杨植麟作为科技公司代表出席,以《开源AI:加速探索智能上限》为主题做了分享,系统阐述了中国AI团队如何通过底层架构的“推倒重建”,打破沿用十年的行业技术标准,建立新一代人工智能的中国技术方案。
![]()
杨植麟在演讲中开宗明义地提出了大模型的第一性原理:“做大模型本质上是把更多的能源转化成智能。” 他认为,规模化(Scaling)是过去所有AI发展的基石,但规模化绝非单纯“暴力”地增加能源或算力投入,而是一场关于转化效率的极致竞赛。为此,他详细拆解了提升效率的三大维度:一是提升 Token效率,从有限的存量数据中挖掘更多智能;二是优化长上下文架构(Kimi Linear),以极低的损耗完成长时复杂任务;三是引入 Agent集群(Agent Swarm)模式,通过协作实现能力的指数级跃迁。
为了实现这种跃迁,杨植麟主张对已有10年左右历史的“老标准”发起挑战。他剖析道,行业长期沿用的Adam优化器、残差连接(ResNet)和注意力机制(Attention),虽然是现代深度学习的基石,但在算力爆发的今天已成为束缚。“很多以前认为是标准的东西,现在都是可以被挑战的。” 为此,Kimi团队推出了创新的“注意力残差”(AttnRes)连接技术。杨植麟分享了一个独特的洞察:将原本应用在时间轴上的注意力机制进行“90度旋转”,应用到网络深度上。这种巧妙的泛化让模型能结合此前所有层的输出进行计算,仅需增加2%的额外成本,即可大幅提升预训练效率与逻辑推理性能。
![]()
在智能体集群的前沿领域,中国方案也在建立新的行业标准。谈及未来智能形态的演进时,杨植麟提出了从“单兵作战”向“智能体集群”跨越的宏大蓝图。他形象地类比道:“就像建造一家千亿美元公司,靠一个人可能要100年,但如果拥有数百个聪明人的高效协作,就能在短时间内完成。” 基于 Kimi K2.5 研发的 Agent 集群,通过编排器调度数百个 Agent 并行工作,在处理从零构建代码仓库等高难度任务时,执行时间不再随复杂度指数级增加。这意味着AI正从简单的对话工具,进化为具备规模化执行能力的“数字组织”。
杨植麟预判,AI研发范式正在发生根本性变革:从最早依赖互联网天然数据和人工标注,到去年大家更重视大规模的强化学习系统,转向由 AI 主导研究的新阶段。未来,AI 将自主合成任务、定义奖励函数,甚至探索新的网络架构。
在演讲的最后,杨植麟表示无论是新一代的 Kimi Linear 架构,还是针对训练稳定性开发的优化工具,月之暗面都选择将其开源,旨在通过底层技术的重新思考,加速全球开发者对AI智能极限的探索。杨植麟坚信,只有通过这种“深挖地基”式的底层创新,才能真正打破模型能力的上限,让智能技术在更广泛的社会与经济领域释放出生产力。
![]()
这种对底层技术的极致追求,使中国AI技术标准的全球影响力加速显现。近期,杨植麟同样以全球唯一受邀独立大模型公司创始人的身份,出席了英伟达年度技术大会 GTC 2026 并发表演讲。估值达3500亿元人民币的美国AI编程巨头 Cursor 承认,其最新发布的旗舰模型正是基于 Kimi K2.5 基座模型进行的二次开发。此外,服务覆盖全球20%网站的互联网基础设施巨头 Cloudflare,也宣布其全新业务 Works AI 全面基于 Kimi K2.5 模型打造。从底层架构到产业应用,源自中国的技术方案正深度融入全球AI产业基础设施,在人工智能时代的国际竞争中贡献中国智慧和中国方案。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.