网易首页 > 网易号 > 正文 申请入驻

月之暗面创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到K100

0
分享至

“希望在接下来的十年、二十年的时间,继续把K4、K5到K100做的更好。”

1月10日,在清华大学基础模型北京市重点实验室主办的AGI-Next前沿峰会上,AI大模型独角兽月之暗面(Kimi)创始人、CEO杨植麟谈到Kimi在未来的发展规划。


澎湃新闻记者 范佳来 摄

在大模型迎来上市潮流之际,同为大模型独角兽的Kimi的资本动态受到外界广泛关注。去年12月31日,杨植麟曾在内部全员信中表示,公司已完成5亿美元C轮融资,账面有超过100亿元人民币的现金储备。

此外,信中还透露,Kimi全球付费用户数月增速170%,受K2 Thinking大模型带动,Kimi在海外的大模型API收入增长4倍。

杨植麟表示,自2019年以来,全球大模型的发展都遵循一个核心规律——Scaling Law,本质上就是“更多算力、更多数据、更大模型参数,能让AI更聪明、犯错更少”。这一规律的落地,离不开主流架构Transformer的支撑。

他举例说明,Transformer与早期的LSTM架构相比,在处理短文本任务时效果相近,但面对长文本、复杂任务时,Transformer能更清晰地记住逻辑关系,就像“看短文章不分上下,读长篇报告则优势明显”,这也成为其适配当下编程、复杂问题求解等场景的关键。

基于这一核心规律,Kimi的技术研发聚焦两大方向:让AI“学东西更快”和“记东西更久”。为实现这两个目标,团队取得了两项关键技术突破。一是推出MUON二阶优化器,相较于行业沿用十年的Adam优化器,新优化器让AI的学习效率翻倍,“原本要读100份资料才能学会的技能,现在50份就够,还学得更扎实”。

二是研发Kimi Linear架构,解决了传统技术“记久了就出错”的问题,在处理百万字级长文本时,速度比传统架构快6-10倍,且逻辑更稳定。

值得一提的是,团队还攻克MUON优化器训练中的“Logit爆炸”难题,通过动态QK-clip技术,在不影响效果的前提下,实现万亿参数级Kimi K2模型的稳定训练。作为中国首个真正意义上的Agent模型,Kimi K2具备两三百步工具调用能力,能独立完成复杂编程、难题推导等任务,在核心测试HLE中准确率达到45%,超越了OpenAI同类模型。

杨植麟透露,目前已有多款中国开源模型成为行业测试标准,“中国技术不仅要好用,还要参与制定规则”。面向未来,团队将持续迭代技术,下一代模型将采用Kimi Delta Attention新型线性注意力机制,进一步提升短长文本任务性能与速度。同时,未来的大模型还将具备更多“审美”和“价值观”,摆脱同质化发展。

对于公众关心的AI安全问题,杨植麟分享与Kimi的对话感悟:“AI可能是人类探索未知的钥匙,能帮我们攻克癌症、解决能源危机、探索宇宙。虽然有风险,但放弃发展就等于放弃人类文明的上限。”

他表示,团队将在做好风险控制的前提下持续突破,计划未来十年、二十年内,陆续推出K4、K5直至K100系列模型。(记者注:目前最新版本的Kimi大模型是K2)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
190万手封死涨停!002131,9天6板!

190万手封死涨停!002131,9天6板!

证券时报e公司
2026-01-14 10:46:51
知乎750万浏览:为什么不能对认知低的人太好?

知乎750万浏览:为什么不能对认知低的人太好?

精读君
2026-01-13 10:00:11
小李子为了嫩模到底有多拼?手在哗哗流血,还施暴式压迫女...

小李子为了嫩模到底有多拼?手在哗哗流血,还施暴式压迫女...

落雪听梅a
2026-01-14 02:07:49
一字跌停,2.5万股民“踩雷”!知名酒企被强制退市,股价蒸发8成

一字跌停,2.5万股民“踩雷”!知名酒企被强制退市,股价蒸发8成

红星新闻
2026-01-13 16:51:07
中科院院士:青年科学家 5 年内拿不出成果就面临淘汰,有的单位已现「马太」效应,重复给某一人奖励

中科院院士:青年科学家 5 年内拿不出成果就面临淘汰,有的单位已现「马太」效应,重复给某一人奖励

化学人生
2026-01-12 20:54:44
拒绝4连败!火箭119-113险胜公牛,三巨头合砍74分,乌度卡淘到宝

拒绝4连败!火箭119-113险胜公牛,三巨头合砍74分,乌度卡淘到宝

小火箭爱体育
2026-01-14 11:33:18
火箭官方晒小贾吐舌一幕!采访显高情商 休媒:决胜时刻3中3觉醒

火箭官方晒小贾吐舌一幕!采访显高情商 休媒:决胜时刻3中3觉醒

颜小白的篮球梦
2026-01-14 12:01:16
3人太关键!火箭119-113公牛:杜兰特28+10+4终结3连败!

3人太关键!火箭119-113公牛:杜兰特28+10+4终结3连败!

运筹帷幄的篮球
2026-01-14 10:13:56
全了!各年龄段血压、血糖、血脂、尿酸对照表,果断收藏

全了!各年龄段血压、血糖、血脂、尿酸对照表,果断收藏

华人星光
2026-01-12 13:14:21
美媒:美军使用最新秘密武器,瘫痪中俄雷达,让委安保失去战斗力

美媒:美军使用最新秘密武器,瘫痪中俄雷达,让委安保失去战斗力

兵国大事
2026-01-12 17:48:56
安德森拒绝曼联心向曼城!儿魔梦球员越来越少,新帝星或成大赢家

安德森拒绝曼联心向曼城!儿魔梦球员越来越少,新帝星或成大赢家

罗米的曼联博客
2026-01-14 10:59:00
官媒发声了!闫学晶儿子入学涉及教育公平,呼吁第三方介入调查

官媒发声了!闫学晶儿子入学涉及教育公平,呼吁第三方介入调查

萌神木木
2026-01-13 22:19:25
火箭首发变阵!29岁射手遭弃用,底薪大闸重回先发,效果立竿见影

火箭首发变阵!29岁射手遭弃用,底薪大闸重回先发,效果立竿见影

熊哥爱篮球
2026-01-14 11:51:32
熬夜猝死只是表象,"口子姐"生前最后一年经历被扒,迟早要出事

熬夜猝死只是表象,"口子姐"生前最后一年经历被扒,迟早要出事

李健政观察
2026-01-13 09:27:27
抄作业了!湖南灿灿效仿呆呆,准备好10头年猪,预计10000人前往

抄作业了!湖南灿灿效仿呆呆,准备好10头年猪,预计10000人前往

火山诗话
2026-01-13 13:41:40
人类对闲鱼的开发不足1%,一群神人把我笑发财了

人类对闲鱼的开发不足1%,一群神人把我笑发财了

另子维爱读史
2026-01-11 21:09:06
中戏辟谣林傲霏新疆班后续!一则旧闻曝光:2012年新疆定向137人

中戏辟谣林傲霏新疆班后续!一则旧闻曝光:2012年新疆定向137人

小徐讲八卦
2026-01-13 08:57:32
小鹰连发两文痛斥皇马球星:一群被宠坏的孩子把阿隆索赶走了

小鹰连发两文痛斥皇马球星:一群被宠坏的孩子把阿隆索赶走了

懂球帝
2026-01-13 22:18:18
为何不能让伊朗倒下?美国若再断中国一条路,我们将更被动

为何不能让伊朗倒下?美国若再断中国一条路,我们将更被动

兵国大事
2026-01-14 00:05:10
这才是格陵兰岛上的真正秘密!

这才是格陵兰岛上的真正秘密!

一个坏土豆
2026-01-11 19:45:41
2026-01-14 12:16:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
870517文章数 5086923关注度
往期回顾 全部

科技要闻

美国批准英伟达H200卖给中国,但有条件

头条要闻

委方:美国袭击爆炸威力巨大 无法对残骸进行DNA鉴定

头条要闻

委方:美国袭击爆炸威力巨大 无法对残骸进行DNA鉴定

体育要闻

牛津学霸买下儿时主队,让它成为英超黑马

娱乐要闻

何晴去世30天,许亚军终于发声

财经要闻

"死了么"App爆火:流量来了 困境未解

汽车要闻

曝Model Y或降到20万以内!

态度原创

本地
游戏
艺术
房产
公开课

本地新闻

云游内蒙|到巴彦淖尔去,赴一场塞上江南的邀约

《GTA6》“高度机密”被曝光?听证会上曝细节!

艺术要闻

八大山人『山水花鸟册』

房产要闻

热销17亿后!天正·三亚湾壹号,被爆违建!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版