网易首页 > 网易号 > 正文 申请入驻

350亿vs25000亿!国产模型正打破美国AI编程垄断

0
分享至



产业竞争的烈火终究是烧到了大模型上,前段时间,知名编程模型Claude的开发商、估值超过3500亿美元(约合25000亿人民币)的Anthropic公司选择对华“断供”。而且不仅是对中国企业,也明确指出包含中国公司持股的海外企业。

国内企业陆续被暂停了Claude API使用,纷纷寻找替代品。包括字节跳动的TRAE和腾讯的CodeBuddy等编程平台的国内版,也被迫下架Claude模型,一时间风声鹤唳。

在大模型百花齐放的今天,Claude断供中国真的如此关键吗?答案是肯定的。

Claude之所以难以被替代,源于其深厚的技术积淀。在复杂算法实现和系统架构设计等高级编程任务中,Claude有更高的完成度,跨越了编程领域“可信”和“可靠”的心理阈值。

然而,机遇往往与危机并存。



1月底,一家中国大模型公司发布的新开源模型,因为突出的编程性能和视觉理解能力,引发了海内外技术社区和开发者的广泛关注。

连续一周登上Twitter科技新闻热搜,仅仅三四天时间,官方发布帖子的阅读量就达到了 680万,甚至不亚于美国OpenAI和Anthropic的旗舰模型发布帖子。顶尖AI技术领袖,160万粉丝的前特斯拉AI总监Andrej Karpathy、卡内基梅隆大学教授Tim Dettmers等专家也点赞恭喜。



从AI行业权威的评测机构LMarena(大模型匿名竞技场)代码能力基准测试中,这个名为Kimi K2.5的中国模型,排在全球开源模型的第一位,仅次于Claude和谷歌Gemini最新的旗舰模型。在前10名的榜单中,也是唯一的中国模型。



美国大模型技术最好的三家公司:OpenAI、Claude和Gemini,因为旗下模型的性能和实际表现总在排行榜的前列,通常被行业称为美国“御三家”。

这是第一次,中国公司通过开源模型打破了美国“御三家”的编程和视觉理解技术垄断。

美国另一家权威评测机构Artificial Analysis和中国模型基准测试机构SuperCLUE的分析都显示,Kimi K2.5模型的智能水平是全球开源第一,仅次于闭源的美国“御三家”。

在特别注重编程性能的AI领域,但凡有一款大模型做到关键指标领先,就会被迅速推开。

Kimi K2.5一经推出后,海外知名编程工具Kilo Code就迅速接入,并宣布首周免费来吸引用户。国内,腾讯旗下编程工具CodeBuddy、字节跳动旗下编程工具TRAE也第一时间上架,因为突出的编程能力,和同时支持视觉的完备性,立即成为首选国产模型。



而发布Kimi K2.5模型的这家中国创业公司,却有个略显“中二”的名字,叫月之暗面。2025年底,他们刚刚完成了C轮35亿元的融资,公司总估值在350亿左右。仅为Anthropic 2.5万亿的1/70。



和很多工业软件一样,在编程大模型领域,中国的业界曾经也处于被卡脖子的状态。

据行业评测数据显示,Claude在复杂算法实现、系统架构设计等高级编程任务中的完成度显著高于行业平均水平。在市场生态方面,Claude也因为先发优势,构建了完整的开发者服务体系,形成了显著的用户粘性,特别是大型企业用户的年均续约率更高。

也正是基于这些优势,Claude的相关模型价格高了国内5-7倍。

那么贵,为什么不用国产?

不得不承认,在这个中国模型亮相之前,国产编程模型存在明显的技术差距。

首先是模型的智能水平,海外模型基本都是万亿参数起步,才能做到对广泛任务和高难度任务的较好应对。中国主要是几千亿参数的模型,难以应对较为复杂的任务,只能做一些非常简单的编程工作。

然后是,中国主流模型在架构设计上普遍采用纯文本预训练,缺乏视觉模块的整体集成。这意味着模型无法理解图像包含的语义信息,在需要多模态理解的场景中表现受限。

比如在前端开发领域。某大型电商平台技术团队曾进行对比测试:当要求模型根据UI设计稿生成前端代码时,必须有很强视觉能力,才能准确识别设计稿中的布局关系、色彩体系和交互元素。

视觉理解能力的技术门槛主要体现在三个层面:首先是视觉信号编码,需要将像素信息转化为有意义的特征表示;其次是跨模态对齐,要求模型理解视觉内容与文本描述之间的关联;最后是统一表示学习,需要建立共享的语义空间。

这些技术难题如同几座大山,阻碍了国产编程模型的进阶之路。

而在实际应用中,这种技术差距直接影响了开发效率。开发效率的差距进一步影响了产品的迭代速度,这在快速变化的市场环境中是致命的。

大模型不同于新能源汽车,要想超车,没有技术以外的捷径可走。

面对技术壁垒,中国公司选择对大模型的底层架构进行革新。

比如Kimi K2.5采用了原生多模态架构,通过ViT+Transformer的混合编码器实现图像和文本的联合表示,在模型底层实现了信号融合。

这种设计相比传统的后期融合方法,在语义保持度和计算效率上具有显著优势,具体而言,模型在训练过程中就建立了视觉与文本的深度关联,而非简单地将两个独立的模型输出进行拼接。

此外,据了解,在Kimi K2.5模型的开发中,这家公司还重点优化了训练基础设施,通过重构强化学习框架,让训练效率提升数倍。

而在视觉理解能力的痛点上,Kimi K2.5更是实现了对Claude的反超:在界面设计稿转代码任务中,Kimi K2.5可准确识别组件的空间关系、样式属性和交互逻辑,代码生成准确率超过Claude。

更为友好的是Kimi K2.5的定价:API调用的输入价格为4元/百万Token,仅为Claude中号模型Sonnet 4.5的1/5,大号模型 Opus 4.5 的1/8。

对于那些每年在大模型上砸数千万元的互联网企业而言,终于等到了一个全功能的、代码和视觉能力都很强的Claude中国平替模型。



当然,一个大模型好不好用,性能到底受不受认可,最终都是市场来说话。

OpenRouter数据显示,Kimi K2.5上线第二天即进入日活跃度前三。



全球最大、估值超千亿的AI搜索创业公司Perplexity,第一时间上架了Kimi K2.5模型,作为给付费用户的高级模型使用。在Perplexity平台上,这也是唯一的中国模型。



从全球开发者的实际反馈来看,这个名为Kimi K2.5的模型,编程能力的表现非常突出, “可以挑战Claude的中号模型Sonnet 4.5,略逊于大号模型Opus 4.5”,同时价格只有他们的1/5到1/8,性价比优势突出。

知名编程工具Cline的开发专家Juan Pa发帖称,他在一项实际编程任务中测试了Codex 5.2、Opus 4.5 和 Kimi K2.5三个模型,他的测试结果是“Kimi K2.5以38%的成本达到了约Opus 90%的质量。”



人工智能专家Mariusz Kurman则建议,“在项目计划阶段使用Opus4.5模型,在创建阶段使用Kimi K2.5模型,可以达到最佳效果。”



在国内技术社区上,开发者们实测之后反馈称,“Kimi K2.5多模态能力以及coding能力还可以的,作为Gemini Pro。Claude和GPT5.2 codex模型的替代也是不错的。国产模型越来越好了。”



一直以来,很多人都以为在AI竞赛上,美国企业主导基础模型层,而中国企业只是擅长应用开发。

2025年初,DeepSeek的出现打破了这种判断。2026年初,这家叫月之暗面的公司推出的新模型,则在编程这个关键领域再次突破了美国模型的垄断。

事实上,这家公司并不是2026年初才横空出世的。早在2025年中,他们就因为首个万亿参数的开源模型K2受到了国际社会的关注,被英国自然杂志称为中国的另一个DeepSeek时刻。

而在硅谷广受欢迎的All-In Podcast中,Kimi K2.5也被直接定义为“开源AI的重要里程碑”。



硅谷知名的风险投资家、企业家Chamath Palihapitiya将Kimi K2.5的发布和带来的反响概括为“Kimi K2.5时刻”。

作为一位曾参加白宫科技圆桌会议并采访过美国总统的权威人士,Chamath认为,开闭源已不只是技术路线之争,而是企业、组织乃至国家层面的“基础设施选择”。

由此可见,我们需要更多的DeepSeek时刻,需要看到更多中国力量的突破,不是一个DeepSeek,而是一大批DeepSeek。特别是在地缘政治不确定性的背景下,本土模型更是中国企业的刚需,因为在核心系统中采用自主可控的AI技术,既是商业选择,也是战略必须。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真心感慨倪妮的长相太神奇了!
单看五官真没一个是完美标配

真心感慨倪妮的长相太神奇了! 单看五官真没一个是完美标配

小光侃娱乐
2026-05-04 19:30:04
入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

搜史君
2026-05-08 13:00:16
中药“销冠”,卖了392亿

中药“销冠”,卖了392亿

药智网网易号
2026-05-11 10:14:14
官僚主义最阴狠的套路:把所有风险,砸向最底层

官僚主义最阴狠的套路:把所有风险,砸向最底层

职场资深秘书
2026-05-08 20:44:41
A股:今天突破4225,准备好了,明天周二大概率这样走!

A股:今天突破4225,准备好了,明天周二大概率这样走!

明心
2026-05-11 15:12:06
从缅甸枪口下救回男友,她却等不来婚礼:网贷,比电诈更狠的刀子

从缅甸枪口下救回男友,她却等不来婚礼:网贷,比电诈更狠的刀子

许三岁
2026-05-10 18:48:07
嘉兴让人给狗道歉女子爆火,还说狗比人金贵。毁三观评论又来了

嘉兴让人给狗道歉女子爆火,还说狗比人金贵。毁三观评论又来了

许三岁
2026-05-11 07:27:45
美军:超20艘美国军舰参与对伊朗实施封锁

美军:超20艘美国军舰参与对伊朗实施封锁

新华社
2026-05-11 09:44:54
女星蔡文静酒后直播,情绪崩溃又哭又笑,一句话引发“陪酒”争议

女星蔡文静酒后直播,情绪崩溃又哭又笑,一句话引发“陪酒”争议

八斗小先生
2026-05-11 15:25:03
女老板介绍她妹妹给我,我说“不如娶你”,第二天她叫我去办公室

女老板介绍她妹妹给我,我说“不如娶你”,第二天她叫我去办公室

千秋文化
2026-05-05 20:23:38
伊朗对英法发出警告

伊朗对英法发出警告

参考消息
2026-05-11 11:16:10
户上隼辅1-3负林诗栋,赛后坦言输给更狠对手

户上隼辅1-3负林诗栋,赛后坦言输给更狠对手

陈赩爱体育
2026-05-11 13:13:19
1951年,戴笠独子被处决的消息传到台湾,蒋介石给毛人凤下了一条命令

1951年,戴笠独子被处决的消息传到台湾,蒋介石给毛人凤下了一条命令

晓张说
2026-04-27 07:18:18
向太这个未来儿媳妇彻底惹毛了她,48岁南昌大姐比向佑大10岁

向太这个未来儿媳妇彻底惹毛了她,48岁南昌大姐比向佑大10岁

小邵说剧
2026-05-11 12:35:20
胖东来新包装矿泉水上架,每瓶涨价0.1元,多个超市不到1小时售罄,线上商城也已卖光,店员称涨价是因成本上涨

胖东来新包装矿泉水上架,每瓶涨价0.1元,多个超市不到1小时售罄,线上商城也已卖光,店员称涨价是因成本上涨

极目新闻
2026-05-10 20:20:39
射程覆盖大半个中国!土耳其突然亮剑,这枚导弹让全球坐不住了

射程覆盖大半个中国!土耳其突然亮剑,这枚导弹让全球坐不住了

花寒弦絮
2026-05-11 09:12:59
印度又赢了!印方新披露“辛杜尔行动”战果:巴机场飞机被毁

印度又赢了!印方新披露“辛杜尔行动”战果:巴机场飞机被毁

万物知识圈
2026-05-11 14:34:05
5月11日晚间,央一、央八、三大卫视黄金档共排播4部新剧,追哪部?

5月11日晚间,央一、央八、三大卫视黄金档共排播4部新剧,追哪部?

小椰的奶奶
2026-05-11 15:26:33
心理学有个发现:下等的挽回,是纠缠;中等的挽回,是断联;顶级的挽回,是让对方做这两件事

心理学有个发现:下等的挽回,是纠缠;中等的挽回,是断联;顶级的挽回,是让对方做这两件事

心理观察局
2026-05-11 09:07:16
申花下一轮踢玉昆前!斯卢茨基将做出重要决定,事关久违强援复出

申花下一轮踢玉昆前!斯卢茨基将做出重要决定,事关久违强援复出

小齐艰难度日
2026-05-11 15:19:58
2026-05-11 15:59:00
无相商业趋势 incentive-icons
无相商业趋势
聚焦新经济,解构新消费,洞察新趋势
1269文章数 37563关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

游戏
家居
亲子
艺术
公开课

红色沙漠又双叒叕更新了!新坐骑新技能还有海量优化

家居要闻

多元生活 此处无声

亲子要闻

首都教育亲子欢乐跑开跑,合作伙伴火花思维携亲子家庭亮相系统

艺术要闻

陆抑非写竹,笔力遒劲

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版