网易首页 > 网易号 > 正文 申请入驻

成立仅两年!登顶全球榜单!这家AI企业,凭啥?

0
分享至

海淀人工智能企业月之暗面,又一次“搞大事情”,火爆海外,引发热烈讨论。今年7月,月之暗面发布的大模型Kimi K2,参数总规模达到万亿级别,成为目前最大的开源模型,并在国际权威大模型排行榜登顶。

此前的2023年10月,月之暗面发布了支持20万汉字输入的Kimi产品,成为行业领头羊,并于2024年3月上线支持200万汉字输入的Kimi新产品。这家一次次在全球大模型领域实现超越的海淀企业,其实很年轻,2023年3月成立,员工平均年龄29岁,大部分员工在海淀总部办公。

为什么月之暗面

能在竞争激烈的全球大模型领域一次次突破?

记者日前走进月之暗面公司

探访“大力出奇迹”的另一面

登顶全球榜单

上次月之暗面引发全球轰动,当属2023年10月Kimi智能助手上线。这是首个支持20万汉字长文本的智能助手产品,引领大模型“无损长上下文”时代。美国人工智能公司OpenAI和Anthropic到当年11月才在长文本上追上来,而在精度(无损记忆)和中文能力上Kimi依然领先。

不到半年后的2024年3月,Kimi上线支持200万汉字输入的新产品。这家初创公司用领先的Kimi大模型产品,确立行业地位,成为中国人工智能大模型阵营的一支劲旅。

此次月之暗面发布的Kimi K2大模型,是一款采用混合专家架构(MoE)的基础模型,总参数1万亿,激活参数320亿。这是全球首个开源万亿参数基础模型。虽然总参数规模达到了万亿级别,由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,有助于控制所需算力。


“既拥有巨大模型的知识和能力,又保持很高的运行效率,能以更低的成本开展更加复杂的工作。”
月之暗面研究员杜羽伦介绍,Kimi K2支持通过应用程序接口调用,定价显著低于“克劳德4”等主流闭源模型。

Kimi K2在代码、数学推理、智能体任务等开源模型基准性能测试中,均取得开源模型中的SOTA(领域内最高水准)成绩。上线一周后,国际权威大模型排行榜LMArena宣布,这一模型成为全球第一的开源模型,并在开闭源总榜上排名第五。截至8月5日,在全球最大开源AI平台Hugging Face上,Kimi K2下载量超过39万次,日均下载量甚至超过了DeepSeek-V3和R1。在全球最大的大模型程序接口(API)聚合网站OpenRouter上,Kimi K2于7月中旬登上趋势榜第一名。

美国西雅图艾伦人工智能研究所机器学习研究员内森·兰伯特7月14日撰文称,今年年初的DeepSeek-R1更像是人工智能发展轨迹中的前传,接下来像Kimi K2这样的模型证明中国可以持续做出惊人的世界级创新。

公司名字的由来

月之暗面海淀总部的门口摆放着一架钢琴,上面有摇滚乐队平克·弗洛伊德的专辑《The Dark Side of the Moon》(《月之暗面》)。月之暗面创始人杨植麟因为这张专辑定下了公司的名称。这架钢琴不是摆设,公司员工在闲暇之余可以自己弹奏。在Kimi K2发布前,月之暗面的员工想听Kimi K2弹钢琴。Kimi K2项目组成员詹皓冰说,大家使用Kimi K2编写了一个MCP(模型上下文协议)工具,让它学会弹钢琴。最终,K2经过识别琴谱、学习运用代码弹钢琴,于发布前夜完整弹奏出了《卡农》。

从零开始,自主学习弹钢琴,正是在大参数下,Kimi K2的核心定位——专为智能体工作流而设计,能够更准确地理解用户的复杂意图,拆解任务,自主调用工具去完成,甚至完成复杂的多步骤流程。

詹皓冰表示,K2的前端编程能力很强,在3D、游戏、动画制作等场景上,用简单的指令和K2交互,就能得到很惊艳的效果。另一方面,智能体的工具调动能力也让模型整体上有了很大提升。如将13万行的原始数据丢给Kimi K2,它可以分析远程办公比例对薪资的影响,并用统一色调做出小提琴图、箱线图、散点图等专业图表,整理成报告。还可以帮用户完成演唱会所在城市的机票、酒店与旅游规划,并且生成日历,再用超文本标记语言概括完整行程规划后发送邮件。

“希望通过全面开源性能更强的模型,进一步加速通用人工智能研究与应用落地的整体进程。”月之暗面相关负责人说。

勤于修炼“内功”

2024年,Kimi大模型用户量增长了100倍,从几十万增长到几千万。2025年1月,Kimi K1.5多模态思考模型发布。此后,直到2025年6月,才发布Kimi-Researcher(深度研究)模型,中间有几个月空档。

在这几个月时间里,月之暗面勤于修炼“内功”。“面对市场环境和竞争格局变化,我们并没有‘一拍脑袋’把强化学习干到底,反而更加注重第一性原理,即先把基座模型做好。所以我们在几个月时间里没有发布任何模型,也拒绝了抢发模型的诱惑,而是做了一件更长期的事。”月之暗面研究员杜羽伦说。

直到7月发布的Kimi K2大模型一鸣惊人,问鼎全球。K2的名称源于乔戈里峰。乔戈里是喀喇昆仑山脉第二个被考察的山峰,国际上公认的命名便是K2。

杜羽伦表示,贯彻第一性原理,做好基座模型这一长期战略看来对团队非常有益,既得到了技术突破,也得到了一个非常好的模型。

月之暗面长达几个月的“闭门修炼”,显示了公司的发展定力和实力,也体现了各方给予公司的包容和耐心。其中,海淀不断强化耐心资本与科技创新深度融合,引导耐心资本投早、投小、投长期、投硬科技,赋予科技创新更大空间。记者了解到,2024年初,月之暗面获得当时国内大模型领域的最大笔融资。截至目前,海淀区已汇聚股权投资管理机构近500家,“十四五”以来辖区企业年均获投金额超700亿元,机构数量、被投案例及资金规模均居全国前列。资本更有耐心,企业更加安心。

当“天才少年”遇到海淀

如果说月之暗面是一匹千里马,那么,这家初创人工智能公司背后,有什么样的伯乐?

记者在月之暗面公司官网看到,公司简介很短,只有100多字。第一段是一句话的公司介绍和一句话的产品介绍。第二段也是一句话,主要内容是创始团队核心成员参与了多个大模型的研发,多项核心技术被多个主流产品采用。

月之暗面公司从全球人工智能大模型企业中脱颖而出,创始人是重要因素。创始人杨植麟是中国35岁以下NLP(自然语言处理)领域被引用最高的研究者,被誉为“天才少年”,两位联合创始人周昕宇和吴育昕都有10000+的谷歌学术搜索引用。

当千里马出现后,怎样助力千里马奋力奔跑、追逐梦想?考验伯乐的知识、远见、气魄等。“月之暗面在成立的两年多时间里,得到海淀区的大力支持,积极协调解决人才引进、算力补贴、房屋租赁等各种困难问题,为企业加快发展奠定坚实基础。”公司相关负责人表示。

人工智能领域人才极度稀缺。而在海淀区,招募人工智能人才有显著优势。海淀区37所高校中,有21所高校开设人工智能本科专业,形成全球最大规模的人工智能人才自主培养体系。全区拥有人工智能学者1.23万名,全市占比超80%。

记者搜索发现,从月之暗面公司出发,步行前往清华大学是2.4公里,前往北京大学是2.9公里。月之暗面创始人杨植麟本科也毕业于清华大学计算机系。

当前,海淀正建设具有全球影响力的人工智能创新策源地和产业高地,给月之暗面这样的人工智能企业提供了深厚的土壤,搭建了良好的生态。海淀区已基本形成芯片、框架、大模型、数据技术与处理服务等技术体系自主可控的人工智能全产业链,成为全国人工智能领域产业基础最好、人力资源最密集、产品迭代最活跃的地区。

2024年,海淀区人工智能核心产业规模达2822亿元,年增速达30%,规模占全市80%。现有人工智能企业1900余家,备案大模型95款、全市占比近70%;全市首个万P级智算集群建成投用。在这片土地上,人工智能企业创新成果持续涌现。

海淀在扶持创业者上,还通过搭平台、办赛事等各种形式促转化,让更多科研成果从“书架”走向“货架”。

“Kimi K2模型目前还没有经过大规模的强化学习,下一版经过大规模强化学习之后,能力会更强,更多工具即将在Kimi上线。”杜羽伦说。

记者:倪恒虎

编辑:罗雨涵

推荐 · 阅读

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
京沪高铁涨价,骂声一片

京沪高铁涨价,骂声一片

凤眼论
2026-05-12 16:53:49
中方对无核武国家鼓吹拥核言论表示关切

中方对无核武国家鼓吹拥核言论表示关切

环球网资讯
2026-05-13 07:54:25
43岁百亿香港女富豪烧炭身亡,公司面临巨大财政压力,比港剧还惨

43岁百亿香港女富豪烧炭身亡,公司面临巨大财政压力,比港剧还惨

王二哥老搞笑
2026-05-13 18:34:29
黄仁勋最后时刻登上“空军一号”释放什么信号

黄仁勋最后时刻登上“空军一号”释放什么信号

环球时报国际
2026-05-13 19:57:24
多地国央企开始发侮辱性工资了!

多地国央企开始发侮辱性工资了!

灯锦年
2026-05-13 20:15:38
女子穿礼服退款后续:身份被扒已社死,工作被停职,商家准备起诉

女子穿礼服退款后续:身份被扒已社死,工作被停职,商家准备起诉

千言娱乐记
2026-05-13 12:18:49
博主曝华为招人偏爱“苦大仇深 来自农村”,因为这种人没躺平的资本

博主曝华为招人偏爱“苦大仇深 来自农村”,因为这种人没躺平的资本

风向观察
2026-05-13 21:17:39
4月汽车销量前十名仅剩一款燃油车!麦肯锡:燃油车中短期内在中国市场不会快速退出历史舞台

4月汽车销量前十名仅剩一款燃油车!麦肯锡:燃油车中短期内在中国市场不会快速退出历史舞台

每日经济新闻
2026-05-13 16:52:04
乌军展开镜像反击,美将俄列为全球最腐败国家,美宣布从欧洲撤军

乌军展开镜像反击,美将俄列为全球最腐败国家,美宣布从欧洲撤军

史政先锋
2026-05-13 18:59:40
闪婚闪离 千万房产该怎么分?法院判了

闪婚闪离 千万房产该怎么分?法院判了

北青网-北京青年报
2026-05-13 15:12:10
国际足联高层来了!与宋凯见面 施压央视:54亿打包两届世界杯

国际足联高层来了!与宋凯见面 施压央视:54亿打包两届世界杯

念洲
2026-05-13 13:25:09
12年交车不足20辆!贾跃亭宣布FF转型:不造车了,改做具身智能机器人

12年交车不足20辆!贾跃亭宣布FF转型:不造车了,改做具身智能机器人

TechWeb
2026-05-13 10:07:03
星链可以当GPS用?马斯克:居然被你们发现了,5月20日就关掉!

星链可以当GPS用?马斯克:居然被你们发现了,5月20日就关掉!

徐德文科学频道
2026-05-13 20:29:16
网传某地事业编欠薪10个月,社保断缴已闹上百姓呼声!

网传某地事业编欠薪10个月,社保断缴已闹上百姓呼声!

灯锦年
2026-05-13 19:39:30
以色列安全部长:需有人告诉亚马尔,他举了一个不存在政权的旗帜

以色列安全部长:需有人告诉亚马尔,他举了一个不存在政权的旗帜

懂球帝
2026-05-13 20:10:42
特朗普36小时北京行,带了两个最反华的人,黄仁勋最后一刻登机

特朗普36小时北京行,带了两个最反华的人,黄仁勋最后一刻登机

邱震海
2026-05-13 20:30:03
太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

魔都姐姐杂谈
2026-05-13 22:44:16
突发!灰熊前锋克拉克去世,年仅29岁

突发!灰熊前锋克拉克去世,年仅29岁

体坛周报
2026-05-13 06:33:13
刚刚!彻夜谈判失败!

刚刚!彻夜谈判失败!

中国半导体论坛
2026-05-13 12:39:51
扎心!朋友孩子的班34人处于“零就业”状态,引热议

扎心!朋友孩子的班34人处于“零就业”状态,引热议

火山詩话
2026-05-13 15:02:14
2026-05-14 00:36:49
北京海淀 incentive-icons
北京海淀
北京市海淀区微政务网易号
13098文章数 5204关注度
往期回顾 全部

科技要闻

腾讯一季度营收1964.6亿元 同比增9%

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

艺术
家居
亲子
游戏
数码

艺术要闻

乾隆 “翻车” 名画刷屏!

家居要闻

内在自叙,无域有方

亲子要闻

孤独症特教老师的工作,远不止“教说话”! (上)

《OW》10周年庆典被老外狂喷"抠死了":把我们当猴耍

数码要闻

小米手环10 Pro陶瓷版亮相,搭配柔软贴合氟橡胶表带

无障碍浏览 进入关怀版