网易首页 > 网易号 > 正文 申请入驻

针锋相对!Kimi和DeepSeek同日发布新模型,对标 OpenAI o1!

0
分享至

国产AI大模型,提前过年了。

1月20日晚间,月之暗面(Kimi)和深度求索(DeepSeek)这两大备受瞩目的AI大模型创业公司,几乎是同时发布了新模型,并均声称新模型的性能对标OpenAI的o1模型。值得注意的是,在DeepSeek发布新模型后的两小时后,Kimi紧随其后也推出了新模型,颇有些“针锋相对”的意味。

在去年年底DeepSeek爆火之后,这家来自来自杭州、低调又神秘的创业公司赚足世人眼球的同时,也极大地改变了国产大模型创业公司的竞争格局,对国产大模型“六小虎”构成了一定的冲击。作为行业的“鲶鱼”,DeepSeek如今的一举一动都搅动着行业的潮流。进入2025年,国产大模型之间的竞争将变得越来越激烈,一场决定存亡的“决战”已经打枪。

同日发布对标OpenAI o1的新模型

1月20日晚间,深度求索公司正式发布新模型DeepSeek-R1,并同步开源模型权重。据官方介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

根据其发布的模型性能评测结果,在美国数学竞赛(AMC)中难度等级最高的AIME以及全球顶级编程竞赛(codeforces)等权威评测中,DeepSeek-R1模型成绩与OpenAI o1不相上下,甚至在某些指标小幅超越OpenAI o1模型。与此同时,除了DeepSeek-R1以外,团队还开源了6个由R1模型蒸馏而来的小型模型,其中的32B与70B模型性能也能比肩OpenAI-o1-mini模型。

在API定价方面,DeepSeek延续了一贯的低价风格, 输入费用低至每百万tokens 1元(缓存命中)/4元(缓存未命中),输出费用仅为每百万tokens 16元,整体支出较o1节省96%,这无疑使得Deepseek-R1在成本效益上具备了压倒性的竞争力。

就在DeepSeek-R1发布后的短短两个小时后,月之暗面也发布了k1.5多模态思考模型。据介绍,从基准测试成绩看,k1.5多模态思考模型实现了SOTA(state-of-the-art)级别的多模态推理和通用推理能力。(在科学研究、技术发展和各种专业领域中,“SOTA”,通常用来指代某个领域中最先进的技术或方法。)

具体来看,在short-CoT模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,领先达到550%;在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。

国产大模型“六小虎”已变为“七小强”

去年12月26日,深度求索宣布全新系列模型DeepSeek-V3上线并同步开源。这一模型不仅以卓越的性能超越或媲美全球顶级的开源及闭源模型,更重要的是训练成本极低,被称为“AI界的拼多多”,以史无前例的性价比被国内外一众圈内大佬点赞,引发广泛关注。

随着DeepSeek-V3的爆火,其背后的大模型创业公司深度求索也进入了大家的视野。过去的半个多月里,全网都在扒DeepSeek背后的团队,并发现DeepSeek团队最大的特点就是年轻,来自清华北大的应届生在其中非常活跃,核心技术岗位基本以应届和毕业一两年的人为主。因此,这个年轻的、由清北应届生撑起来的公司也被称为“组织形态上最像OpenAI的中国AI公司”。

业内人士分析称,DeepSeek从创立开始就是中国大模型的技术创新者,在大厂和创业公司都在遵循着Llama架构的时候,它选择对模型架构进行了全方位创新,提出的一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%—13%,同时独创的DeepSeekMoESparse结构也把计算量降到极致,最终促成了成本的下降。而且与早期的OpenAI类似的是,Deepseek兼具高密度的人才团队和持续创新的精神,因而能持续地给中国大模型带来惊喜。

而事实上,月之暗面也曾被视为“最有可能成为中国OpenAI的公司”。去年年初,月之暗面凭借以长文本为核心优势的Kimi智能助手产品火爆出圈。彼时,头顶着“90后清华校友技术天才创业者”“最强长文本”等诸多光环,月之暗面迅速完成了巨额的融资,吸引一众知名投资机构加持,跻身“200亿元估值俱乐部”,成为国产大模型创业公司的“顶流”。

然而在爆火之后,Kimi因激进的流量投放策略、创始人套现传闻、投资人仲裁风波等事件,屡屡陷入舆论的风口浪尖。与此同时,国产大模型的竞赛在经历了“百模大战”后,尚留在牌桌中的玩家之间的竞争也更趋于激烈。Kimi不仅在流量投放上面临着字节豆包的疯狂进攻,而且竞争对手也纷纷发力长文本能力,Kimi的优势逐渐变得不那么明显。

头顶着“清北应届生”光环的DeepSeek,无疑给包括Kimi在内的国产大模型创业公司带来了压力。业内有人认为,DeepSeek事实上已经可以和“六小虎”(智谱AI、月之暗面、百川智能、Minimax、阶跃星辰、零一万物)并列成为“七小强”。更重要的是,DeepSeek由国内知名量化资管巨头幻方量化创立,未进行过任何融资,特点是“少花钱多办事”,与依靠融资输血、估值水涨船高的其他创业公司相比显得格外另类。

这一低调的技术黑马,无论是技术路线还是发展模式,都走出了一条与众不同的道路,也改变了国产大模型的竞争格局。随着竞争继续向深水区挺进,谁能留在牌桌上笑到最后,或许能在2025年见分晓。

责编:李丹

校对:祝甜婷

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发!上海最大商场砸的62亿悬了!

突发!上海最大商场砸的62亿悬了!

新浪财经
2026-03-26 00:14:57
郜林:来铭途一个月没开过会;当总经理和踢球不同

郜林:来铭途一个月没开过会;当总经理和踢球不同

懂球帝
2026-03-26 22:00:56
中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

长风文史
2026-03-25 17:58:23
中美卫星导航用户数量悬殊:GPS用户数超60亿,中国北斗令人意外

中美卫星导航用户数量悬殊:GPS用户数超60亿,中国北斗令人意外

混沌录
2026-03-18 23:54:31
伊朗新最高领袖莫贾塔巴哈梅内伊已同意与美国进行谈判并达成协议

伊朗新最高领袖莫贾塔巴哈梅内伊已同意与美国进行谈判并达成协议

深度报
2026-03-25 22:47:08
华为、商汤等873家机构遭AI顶会“封杀”,中国学界怒了

华为、商汤等873家机构遭AI顶会“封杀”,中国学界怒了

智东西
2026-03-26 20:49:23
巴基斯坦把稀土卖给美国,以为捏住中国“七寸”,其实在玩火自焚

巴基斯坦把稀土卖给美国,以为捏住中国“七寸”,其实在玩火自焚

通文知史
2026-03-24 08:35:03
宋美龄书法对比:钢笔字似小学生,英文手稿如中学生!

宋美龄书法对比:钢笔字似小学生,英文手稿如中学生!

书画相约
2026-03-26 07:49:18
先被里瓦尔多全面逆袭,后遭齐达内强势碾压,全能战士时运不济

先被里瓦尔多全面逆袭,后遭齐达内强势碾压,全能战士时运不济

足篮大世界
2026-03-26 10:52:09
三次精准躲过斩首行动,卡尼突然现身反转剧情,伊朗这局水太深了

三次精准躲过斩首行动,卡尼突然现身反转剧情,伊朗这局水太深了

盛夏微凉
2026-03-24 18:10:08
卡尔森:坏了!原来小丑不是特朗普,而是我自己

卡尔森:坏了!原来小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
真的太孤独了!山东47岁母亲称已怀胎8月,两女远嫁却极力反对…

真的太孤独了!山东47岁母亲称已怀胎8月,两女远嫁却极力反对…

火山詩话
2026-03-25 13:41:56
张近东资产清零,张朝阳手握百亿现金:两种人生,一个忠告

张近东资产清零,张朝阳手握百亿现金:两种人生,一个忠告

老特有话说
2026-03-26 14:31:44
一天蒸发6200亿!谷歌算法黑科技击溃存储股,华尔街痛批市场“不懂技术”

一天蒸发6200亿!谷歌算法黑科技击溃存储股,华尔街痛批市场“不懂技术”

每日经济新闻
2026-03-26 19:00:13
中国摩托在越南被日本本田打的惨败!现在又一路翻盘,太解气!

中国摩托在越南被日本本田打的惨败!现在又一路翻盘,太解气!

万物知识圈
2026-03-26 15:19:33
苹果受追捧,国产手机涨价基本失败了,正在悄悄降价

苹果受追捧,国产手机涨价基本失败了,正在悄悄降价

柏铭锐谈
2026-03-24 15:38:55
马英九亲自下场后,蓝营大佬集体回应,台媒体人:罪在马英九

马英九亲自下场后,蓝营大佬集体回应,台媒体人:罪在马英九

DS北风
2026-03-25 18:50:17
iPhone半夜自动打电话,苹果官网发文回应

iPhone半夜自动打电话,苹果官网发文回应

界面新闻
2026-03-26 15:46:22
公积金新调整!4月1日起,职工可自愿提高缴存比例

公积金新调整!4月1日起,职工可自愿提高缴存比例

另子维爱读史
2026-03-25 22:28:47
颖儿太敢了!素颜曝光脸颊凹陷,做医美全程不藏着,疼到五官扭曲

颖儿太敢了!素颜曝光脸颊凹陷,做医美全程不藏着,疼到五官扭曲

圆梦的小老头
2026-03-26 21:31:03
2026-03-27 00:00:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
886709文章数 238940关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
手机
健康
游戏
军事航空

400万人爱过的女孩,被黄谣网暴180天后

手机要闻

OPPO K15 Pro 系列定档,岚影呼吸灯搭配金属中框

转头就晕的耳石症,能开车上班吗?

"死亡搁浅"外骨骼来了!小岛工作室转发联名 原度拉满

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版