网易首页 > 网易号 > 正文 申请入驻

350亿vs25000亿!国产模型正打破美国AI编程垄断

0
分享至



产业竞争的烈火终究是烧到了大模型上,前段时间,知名编程模型Claude的开发商、估值超过3500亿美元(约合25000亿人民币)的Anthropic公司选择对华“断供”。而且不仅是对中国企业,也明确指出包含中国公司持股的海外企业。

国内企业陆续被暂停了Claude API使用,纷纷寻找替代品。包括字节跳动的TRAE和腾讯的CodeBuddy等编程平台的国内版,也被迫下架Claude模型,一时间风声鹤唳。

在大模型百花齐放的今天,Claude断供中国真的如此关键吗?答案是肯定的。

Claude之所以难以被替代,源于其深厚的技术积淀。在复杂算法实现和系统架构设计等高级编程任务中,Claude有更高的完成度,跨越了编程领域“可信”和“可靠”的心理阈值。

然而,机遇往往与危机并存。



1月底,一家中国大模型公司发布的新开源模型,因为突出的编程性能和视觉理解能力,引发了海内外技术社区和开发者的广泛关注。

连续一周登上Twitter科技新闻热搜,仅仅三四天时间,官方发布帖子的阅读量就达到了 680万,甚至不亚于美国OpenAI和Anthropic的旗舰模型发布帖子。顶尖AI技术领袖,160万粉丝的前特斯拉AI总监Andrej Karpathy、卡内基梅隆大学教授Tim Dettmers等专家也点赞恭喜。



从AI行业权威的评测机构LMarena(大模型匿名竞技场)代码能力基准测试中,这个名为Kimi K2.5的中国模型,排在全球开源模型的第一位,仅次于Claude和谷歌Gemini最新的旗舰模型。在前10名的榜单中,也是唯一的中国模型。



美国大模型技术最好的三家公司:OpenAI、Claude和Gemini,因为旗下模型的性能和实际表现总在排行榜的前列,通常被行业称为美国“御三家”。

这是第一次,中国公司通过开源模型打破了美国“御三家”的编程和视觉理解技术垄断。

美国另一家权威评测机构Artificial Analysis和中国模型基准测试机构SuperCLUE的分析都显示,Kimi K2.5模型的智能水平是全球开源第一,仅次于闭源的美国“御三家”。

在特别注重编程性能的AI领域,但凡有一款大模型做到关键指标领先,就会被迅速推开。

Kimi K2.5一经推出后,海外知名编程工具Kilo Code就迅速接入,并宣布首周免费来吸引用户。国内,腾讯旗下编程工具CodeBuddy、字节跳动旗下编程工具TRAE也第一时间上架,因为突出的编程能力,和同时支持视觉的完备性,立即成为首选国产模型。



而发布Kimi K2.5模型的这家中国创业公司,却有个略显“中二”的名字,叫月之暗面。2025年底,他们刚刚完成了C轮35亿元的融资,公司总估值在350亿左右。仅为Anthropic 2.5万亿的1/70。



和很多工业软件一样,在编程大模型领域,中国的业界曾经也处于被卡脖子的状态。

据行业评测数据显示,Claude在复杂算法实现、系统架构设计等高级编程任务中的完成度显著高于行业平均水平。在市场生态方面,Claude也因为先发优势,构建了完整的开发者服务体系,形成了显著的用户粘性,特别是大型企业用户的年均续约率更高。

也正是基于这些优势,Claude的相关模型价格高了国内5-7倍。

那么贵,为什么不用国产?

不得不承认,在这个中国模型亮相之前,国产编程模型存在明显的技术差距。

首先是模型的智能水平,海外模型基本都是万亿参数起步,才能做到对广泛任务和高难度任务的较好应对。中国主要是几千亿参数的模型,难以应对较为复杂的任务,只能做一些非常简单的编程工作。

然后是,中国主流模型在架构设计上普遍采用纯文本预训练,缺乏视觉模块的整体集成。这意味着模型无法理解图像包含的语义信息,在需要多模态理解的场景中表现受限。

比如在前端开发领域。某大型电商平台技术团队曾进行对比测试:当要求模型根据UI设计稿生成前端代码时,必须有很强视觉能力,才能准确识别设计稿中的布局关系、色彩体系和交互元素。

视觉理解能力的技术门槛主要体现在三个层面:首先是视觉信号编码,需要将像素信息转化为有意义的特征表示;其次是跨模态对齐,要求模型理解视觉内容与文本描述之间的关联;最后是统一表示学习,需要建立共享的语义空间。

这些技术难题如同几座大山,阻碍了国产编程模型的进阶之路。

而在实际应用中,这种技术差距直接影响了开发效率。开发效率的差距进一步影响了产品的迭代速度,这在快速变化的市场环境中是致命的。

大模型不同于新能源汽车,要想超车,没有技术以外的捷径可走。

面对技术壁垒,中国公司选择对大模型的底层架构进行革新。

比如Kimi K2.5采用了原生多模态架构,通过ViT+Transformer的混合编码器实现图像和文本的联合表示,在模型底层实现了信号融合。

这种设计相比传统的后期融合方法,在语义保持度和计算效率上具有显著优势,具体而言,模型在训练过程中就建立了视觉与文本的深度关联,而非简单地将两个独立的模型输出进行拼接。

此外,据了解,在Kimi K2.5模型的开发中,这家公司还重点优化了训练基础设施,通过重构强化学习框架,让训练效率提升数倍。

而在视觉理解能力的痛点上,Kimi K2.5更是实现了对Claude的反超:在界面设计稿转代码任务中,Kimi K2.5可准确识别组件的空间关系、样式属性和交互逻辑,代码生成准确率超过Claude。

更为友好的是Kimi K2.5的定价:API调用的输入价格为4元/百万Token,仅为Claude中号模型Sonnet 4.5的1/5,大号模型 Opus 4.5 的1/8。

对于那些每年在大模型上砸数千万元的互联网企业而言,终于等到了一个全功能的、代码和视觉能力都很强的Claude中国平替模型。



当然,一个大模型好不好用,性能到底受不受认可,最终都是市场来说话。

OpenRouter数据显示,Kimi K2.5上线第二天即进入日活跃度前三。



全球最大、估值超千亿的AI搜索创业公司Perplexity,第一时间上架了Kimi K2.5模型,作为给付费用户的高级模型使用。在Perplexity平台上,这也是唯一的中国模型。



从全球开发者的实际反馈来看,这个名为Kimi K2.5的模型,编程能力的表现非常突出, “可以挑战Claude的中号模型Sonnet 4.5,略逊于大号模型Opus 4.5”,同时价格只有他们的1/5到1/8,性价比优势突出。

知名编程工具Cline的开发专家Juan Pa发帖称,他在一项实际编程任务中测试了Codex 5.2、Opus 4.5 和 Kimi K2.5三个模型,他的测试结果是“Kimi K2.5以38%的成本达到了约Opus 90%的质量。”



人工智能专家Mariusz Kurman则建议,“在项目计划阶段使用Opus4.5模型,在创建阶段使用Kimi K2.5模型,可以达到最佳效果。”



在国内技术社区上,开发者们实测之后反馈称,“Kimi K2.5多模态能力以及coding能力还可以的,作为Gemini Pro。Claude和GPT5.2 codex模型的替代也是不错的。国产模型越来越好了。”



一直以来,很多人都以为在AI竞赛上,美国企业主导基础模型层,而中国企业只是擅长应用开发。

2025年初,DeepSeek的出现打破了这种判断。2026年初,这家叫月之暗面的公司推出的新模型,则在编程这个关键领域再次突破了美国模型的垄断。

事实上,这家公司并不是2026年初才横空出世的。早在2025年中,他们就因为首个万亿参数的开源模型K2受到了国际社会的关注,被英国自然杂志称为中国的另一个DeepSeek时刻。

而在硅谷广受欢迎的All-In Podcast中,Kimi K2.5也被直接定义为“开源AI的重要里程碑”。



硅谷知名的风险投资家、企业家Chamath Palihapitiya将Kimi K2.5的发布和带来的反响概括为“Kimi K2.5时刻”。

作为一位曾参加白宫科技圆桌会议并采访过美国总统的权威人士,Chamath认为,开闭源已不只是技术路线之争,而是企业、组织乃至国家层面的“基础设施选择”。

由此可见,我们需要更多的DeepSeek时刻,需要看到更多中国力量的突破,不是一个DeepSeek,而是一大批DeepSeek。特别是在地缘政治不确定性的背景下,本土模型更是中国企业的刚需,因为在核心系统中采用自主可控的AI技术,既是商业选择,也是战略必须。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿森纳欧冠八场全胜,奖金却不及利物浦曼城

阿森纳欧冠八场全胜,奖金却不及利物浦曼城

浮萍足球
2026-02-03 01:43:10
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
退货误寄奔驰钥匙后续,平台介入调查,奔驰车主:该女子绝对说谎

退货误寄奔驰钥匙后续,平台介入调查,奔驰车主:该女子绝对说谎

削桐作琴
2026-02-02 17:10:29
突然发现我妈好像没有朋友?网友分享一针见血:看完沉默了

突然发现我妈好像没有朋友?网友分享一针见血:看完沉默了

另子维爱读史
2026-02-02 21:18:30
马斯克:特斯拉成功实现干电极工艺规模化生产,这是锂电池生产技术里程碑式突破【附锂电池行业市场分析】

马斯克:特斯拉成功实现干电极工艺规模化生产,这是锂电池生产技术里程碑式突破【附锂电池行业市场分析】

新浪财经
2026-02-02 18:07:37
爷爷每年给孙子买生肖金条,目前已买8根,称“无论金价涨跌都要买,想留点东西给他”

爷爷每年给孙子买生肖金条,目前已买8根,称“无论金价涨跌都要买,想留点东西给他”

极目新闻
2026-02-02 14:24:54
赢了官司却亏到吐血!嫣然医院搬家,房东成年度最大笑话!

赢了官司却亏到吐血!嫣然医院搬家,房东成年度最大笑话!

达文西看世界
2026-01-20 13:35:51
江苏响水连申线月港大桥垮塌已造成2人死亡3人失联

江苏响水连申线月港大桥垮塌已造成2人死亡3人失联

环球网资讯
2026-02-03 01:08:17
伊朗军方发言人对特朗普放话:你想快打快撤不是什么新闻,我们将向以色列和美军基地所在国还击

伊朗军方发言人对特朗普放话:你想快打快撤不是什么新闻,我们将向以色列和美军基地所在国还击

大象新闻
2026-01-31 15:45:13
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
豪购 英超两豪门报价9500万欧疯抢巴西巨星 税后年薪高达2200万欧

豪购 英超两豪门报价9500万欧疯抢巴西巨星 税后年薪高达2200万欧

零度眼看球
2026-02-02 09:12:18
江西省委书记:加大对年轻干部违纪违法行为的查处力度

江西省委书记:加大对年轻干部违纪违法行为的查处力度

新京报政事儿
2026-02-02 21:52:51
郑爽张恒两家再起争执!34岁郑爽满头白发显沧桑,孩子哭闹场面扎心

郑爽张恒两家再起争执!34岁郑爽满头白发显沧桑,孩子哭闹场面扎心

八星人
2026-02-01 21:02:27
“很晦气,这房子不敢住了!” 杭州夫妻买房2年后得知一个消息,想退房了

“很晦气,这房子不敢住了!” 杭州夫妻买房2年后得知一个消息,想退房了

潇湘晨报
2026-01-31 10:38:17
军事 | 特朗普称在谈,哈梅内伊也称在谈,那么美国伊朗会打吗?

军事 | 特朗普称在谈,哈梅内伊也称在谈,那么美国伊朗会打吗?

新民周刊
2026-02-02 09:11:02
便利背后暗藏风险 手机“贴一贴”可能无形中危害国家安全

便利背后暗藏风险 手机“贴一贴”可能无形中危害国家安全

大象新闻
2026-02-02 06:57:23
男人上了年纪,鞋子尽量别穿耐克、李宁,换成这些中产品牌更高级

男人上了年纪,鞋子尽量别穿耐克、李宁,换成这些中产品牌更高级

莉莉和奶奶
2026-02-02 06:48:07
1746个螺母,被警方认定为枪支散件,五金厂老板获刑!老板喊冤

1746个螺母,被警方认定为枪支散件,五金厂老板获刑!老板喊冤

胡侃社会百态
2026-02-02 12:24:44
总统是间谍?美国最新机密文件显示:特朗普是傀儡,早已被以色列收买

总统是间谍?美国最新机密文件显示:特朗普是傀儡,早已被以色列收买

不掉线电波
2026-02-01 15:52:15
广州地铁深夜致歉

广州地铁深夜致歉

南方都市报
2026-02-02 10:05:37
2026-02-03 03:44:49
无相商业趋势 incentive-icons
无相商业趋势
聚焦新经济,解构新消费,洞察新趋势
1231文章数 37561关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

江苏在建大桥垮塌致2死3失联 现场画面公布

头条要闻

江苏在建大桥垮塌致2死3失联 现场画面公布

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

本地
时尚
健康
数码
房产

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

裤子+靴子:今年冬天最经典搭配,松弛又时髦!

耳石症分类型,症状大不同

数码要闻

LG宣布停止生产8K电视 内容匮乏与需求不振让“超高清时代”夭折

房产要闻

狂卖1548亿后,海南又上演疯狂抢地!

无障碍浏览 进入关怀版