网易首页 > 网易号 > 正文 申请入驻

黄仁勋:Token是新大宗商品。中国:收到,已卖疯

0
分享至

从DeepSeek的训练方法论到Kimi的核心网络突破,中国AI正从开源路线的跟随者变为引领者,在GTC舞台上与黄仁勋共议Token经济学——这场由效率和创新驱动的新纪元,中国已稳稳确立航标。

———— / BEGIN / ————

“Token是新的大宗商品。”

这是黄仁勋在GTC 2026年度开发者大会上的判断。

趋势已经形成:无形的海量Token顺着网线,卖到了全球各地,就像有形的大宗商品通过轮船、路网卖到全球各地一样。

其中,中国的Token,最近在海外卖疯了。

全球最大的AI模型API聚合平台OpenRouter数据显示,2月16日-2月22日一周时间里,中国模型的周调用量高达5.16万亿Token,而同期美国模型调用量只有2.7万亿Token。

平台调用量排名前五的大模型,四款是中国的,分别为MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM5以及DeepSeek的V3.2。

外国人正在用真金白银选择中国AI大模型。

跨越性价比,迈入底层创新

早期,海外市场对中国模型的青睐或许始于“物美价廉”的Token。

但今年以来,中国团队已经开始在最基础的架构上,改写AI 研发的底层逻辑。

最近,月之暗面团队发布的论文《Attention Residuals》就是这一趋势的代表,直接动摇了Transformer架构中沿用近十年的基石——残差连接。

自2015年何恺明提出ResNet以来,残差连接以其“将输入直接加到输出上”的朴素逻辑,成为几乎所有深度神经网络的标配。

然而,这种固定权重、均匀累加的机制,像一台没有筛选功能的信息搅拌机。早期层计算出的宝贵特征,在向深层传递时,其相对贡献度随深度衰减,最终被淹没在后续层输出的“噪声”中。

《Attention Residuals》打破了这个十年未动的默认配置。它为每一层配备一个可学习的查询向量(query),让该层根据当前处理的内容,动态决定最需要参考哪些前序层的结果。

就像是给每一层加了一部手机,遇到具体需求时,能随时精准查询上面任何一层自己所需的数据。

这种回归第一性原理的改进,相比传统残差连接,节省了约 20%的计算量,但其意义显然更为深远。

这也是为何向来推崇“打破常规”的马斯克会对其公开点赞,前Open AI 联合创始人Karpathy 也在看完研究后,发出需要“重新理解架构”的感慨。

这说明,大模型的架构优化和技术创新已经从 Attention、MoE 这些上层模块,深入到了最底层的残差连接。

而在大模型最硬核的技术深水区里,中国AI正在稳稳确立自己的新航标。


坚持开源,贡献中国突破

在过去一年,中国大模型已经不是偶发的“单点突破”,而是集群发力。

全球业界已经清晰地意识到,创新的发源地正在东移。


海外科技评论人Tuki发文称,去年1月,Deepseek靠极致的推理成本和R1震撼了硅谷。紧接着,Kimi带着更优的运行成本来了。

这背后其实隐藏着一条更宏大的主线:当下全球 AI 的竞争,本质上已经不仅是地域之间的角力,更是“开源”与“闭源”路线的交锋。

作为全球开源模型的代表,DeepSeek带来了训练方法论的创新,Kimi则从核心网络架构突破。

正是这种扎根底层的开源创新,赋予了中国团队在全球顶级科技舞台上的话语权。比如,Kimi创始人杨植麟成为本届 GTC唯一受邀现场演讲的独立大模型公司创始人。

在GTC的主舞台上,他围绕Token效率、长文本、Agent集群,全面披露了开源模型K2.5的技术路线。

这向全球传递了一个非常明确的信号:中国的AI创新者不仅在跟随,更在引领创新。

在大模型的训练方法、模型架构等方面,中国AI不仅能够取得原创性的创新成果,而且愿意以开源的方式回馈全球开发者。

价值重估,现金飞轮转不停

全球对中国AI创新能力的认可,最直观的映射在资本市场。简单来说,技术愿景最终需要真金白银的投票。反映到资本市场上,就是估值提高。

二级市场上,今年刚上市的智谱、Minimax股价屡创新高。

一级市场上,Kimi在不到3个月,先后完成3轮融资,估值翻4倍,达到180亿美元(约1200亿人民币)。

这一融资节奏和体量,在当下愈发慎重的资本市场环境中,堪称奇迹。

不过,如果仅仅将其归结为资本对某一家公司“技术护城河”的盲目追捧,显然是天真的。

资本真正在押注的,是中国AI产业跑通的一条与硅谷截然不同的道路。

硅谷巨头习惯了“大力出奇迹”,用天价的算力和数据去暴力喂养模型,这本质上是一种粗放的“高耗电”模式。一旦进入深水区,极易被高昂的推理成本拖垮。

而以DeepSeek、Kimi为代表的中国团队,走的是另一条路——在算法优化和模型架构上做到极致的精打细算。

无论是R1的训练方法,还是《Attention Residuals》对十年旧架构的重构,本质上都是发明了一种极低能耗、极高效率的“用电方式”。用更少的Token,榨取出了更高的模型智能。

在这个逻辑下,市场的投票也无比迅速。当全球开发者和企业发现,在这样性价比的基座上运行复杂任务,不仅逻辑更稳,而且调用成本极低时,流量与订单便会激增。

这也解释了,为什么Kimi在今年1月发布K2.5模型后,短短20天内的商业收入,就超过了2025年的全年收入。

这种将技术突破转化为开源基础设施,同时又跑通商业飞轮的能力,才是支撑起中国大模型千亿估值、并持续运转的原因。

黄仁勋在GTC上断言,Token是新时代的大宗商品。

而历史告诉我们,在大宗商品的全球贸易网络中,最终掌握定价权和主导权的,往往不是拥有最多原始粗矿的玩家,而是拥有高效提炼与转化技术的人。

当5.16万亿个中国Token顺着网线流向全球,一个清晰的事实已经浮出水面:

在这个由Token驱动的新纪元里,中国AI正在以令人惊叹的效率和创新,重构全球智能算力的贸易版图。

参考资料

[2603.15031] Attention Residuals https://arxiv.org/abs/2603.15031

Kimi杨植麟:很多普遍使用的技术标准正成为Scaling的瓶颈 https://m.thepaper.cn/newsDetail_forward_32787861

马斯克惊叹!DeepSeek和Kimi先后出手,捅破了Transformer的「潜规则」! https://mp.weixin.qq.com/s/BQNhy8vo1bMn5uNHyamYlQ

将注意力旋转 90 度!今天,Kimi 的「注意力残差」火了 https://mp.weixin.qq.com/s/rrWCapCip7PtYDHxMm73GA?scene=1

Kimi新架构让马斯克叹服!17岁高中生作者一战成名 https://mp.weixin.qq.com/s/grWJ9EH_4RdeLymRetAT4w Attention

转个方向,Transformer动到了骨髓 https://mp.weixin.qq.com/s/gUk77lcu0wKk0Y-f1pH2Jg

估值1200亿,Kimi融资破纪录了 https://mp.weixin.qq.com/s/Yu3pGfrEBrL4yZk41o8cug

哥飞锐评 kimi、MiniMax、Manus、Cursor - 小红书 https://www.xiaohongshu.com/explore/69aaa0b60000000022032e7a?source=webshare&xhsshare=pc_web&xsec_token=ABrgGSSTkpeUbLZJmgcefNg8VQAZ5h1DF905Jb9Y6vFR0=&xsec_source=pc_share

深度丨2年,30倍,100亿美元估值,一场比字节还快的极速增长 https://mp.weixin.qq.com/s/lMpNBzbSpu8bgQ2-_uFAdQ

月之暗面创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到K100 https://mp.weixin.qq.com/s/0QJhrwCbkL3nGXX8e5qjpA

黄仁勋GTC 2026演讲全文:直指推理性能、“token经济学”、OpenClaw智能体革命…… https://mp.weixin.qq.com/s/Ta4jY8KfItjIVb82cW08aQ

20天收入超2025全年,龙虾爆火的受益者Kimi能否弯道超车? https://mp.weixin.qq.com/s/mKkNhbKE4af6HWc-CMZWww?scene=1&click_id=8

本文来自公众号:非凡油条 作者:豆腐乳儿

想要第一时间了解行业动态、面试技巧、商业知识等等等?加入产品经理进化营,跟优秀的产品人一起交流成长!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗官方确认:翼龙-2首次参战即被击落,海湾国家反应强烈

伊朗官方确认:翼龙-2首次参战即被击落,海湾国家反应强烈

衣服固元膏
2026-04-04 15:53:17
世界杯女单决赛孙颖莎战胜王曼昱,创历史实现三连冠

世界杯女单决赛孙颖莎战胜王曼昱,创历史实现三连冠

澎湃新闻
2026-04-05 20:42:27
美军营救行动致伊朗5死8伤

美军营救行动致伊朗5死8伤

新华社
2026-04-05 16:43:14
伊朗称击落美C-130运输机 美国:我们自己炸的

伊朗称击落美C-130运输机 美国:我们自己炸的

看看新闻Knews
2026-04-05 14:35:15
伊朗搜捕人员距飞行员藏身地不到3公里!美军营救代价惨烈,损失飞机价值超4亿美元

伊朗搜捕人员距飞行员藏身地不到3公里!美军营救代价惨烈,损失飞机价值超4亿美元

红星新闻
2026-04-05 18:49:42
安徽6岁女童已丢4天,亲属发声曝猛料,难怪搜救犬闻不到气味

安徽6岁女童已丢4天,亲属发声曝猛料,难怪搜救犬闻不到气味

奇思妙想草叶君
2026-04-04 23:58:32
历史第一人!孙颖莎胜王曼昱,获澳门世界杯三连冠

历史第一人!孙颖莎胜王曼昱,获澳门世界杯三连冠

体坛周报
2026-04-05 20:58:17
真实的赵丽颖,你们能接受吗?

真实的赵丽颖,你们能接受吗?

小椰的奶奶
2026-04-05 17:17:17
美国明明是全球第一产油国,为何还要死磕中东高硫原油?

美国明明是全球第一产油国,为何还要死磕中东高硫原油?

知识圈
2026-04-05 10:42:35
周杰伦塌房!什么原创王子,他的这么多歌竟然都是抄来的

周杰伦塌房!什么原创王子,他的这么多歌竟然都是抄来的

可达鸭面面观
2026-04-05 16:59:56
医院就诊患者惊现“某某之女”被怒斥!网友:打拳打到新生儿科了

医院就诊患者惊现“某某之女”被怒斥!网友:打拳打到新生儿科了

火山詩话
2026-04-04 17:02:01
“自动铅笔”事件火了,面相学果然权威,带入同学视角天都塌了!

“自动铅笔”事件火了,面相学果然权威,带入同学视角天都塌了!

番外行
2026-04-04 12:52:45
非常罕见,特斯拉突然推出全新配置!

非常罕见,特斯拉突然推出全新配置!

XCiOS俱乐部
2026-04-05 20:27:23
托马斯·弗里德曼:特朗普该如何退出伊朗战争?

托马斯·弗里德曼:特朗普该如何退出伊朗战争?

参考消息
2026-04-05 20:36:11
涉嫌严重违纪违法,虞安生被查

涉嫌严重违纪违法,虞安生被查

吉刻新闻
2026-04-05 20:05:38
孙颖莎再创历史!4-1王曼昱,斩获3连冠,赛后发声,展现高情商

孙颖莎再创历史!4-1王曼昱,斩获3连冠,赛后发声,展现高情商

萌兰聊个球
2026-04-05 21:15:03
国防科技大学历任校长

国防科技大学历任校长

祁州校尉
2026-04-05 17:30:05
云南3岁女童在家被眼镜王蛇咬伤全身瘫痪,假死3天奇迹生还

云南3岁女童在家被眼镜王蛇咬伤全身瘫痪,假死3天奇迹生还

大象新闻
2026-04-05 00:48:02
美军失联飞行员获救?当地山区海拔最高4400米,号称“波斯之门”,山民善于射击

美军失联飞行员获救?当地山区海拔最高4400米,号称“波斯之门”,山民善于射击

红星新闻
2026-04-05 13:00:26
美军飞行员获救,细节公开:48小时建简易机场,搭进去5架飞机

美军飞行员获救,细节公开:48小时建简易机场,搭进去5架飞机

起喜电影
2026-04-05 16:22:24
2026-04-05 22:15:00
运营派
运营派
互联网运营学习交流平台
1804文章数 28关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

网友晒图称曹操墓前摆满了布洛芬 高陵遗址博物馆回应

头条要闻

网友晒图称曹操墓前摆满了布洛芬 高陵遗址博物馆回应

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

房产
艺术
健康
游戏
军事航空

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

艺术要闻

王少伦 风景油画选刊

干细胞抗衰4大误区,90%的人都中招

LPL第二赛段:先锋赛冠军还是厉害,死战不退,BLG三局战胜JDG

军事要闻

美飞行员获救细节:美伊发生激烈交火 至少4死1伤

无障碍浏览 进入关怀版