码农财经 | 2026.05.26
如果你这两天刚好盯盘又刷技术圈,会有一种强烈的"两条线在同一个夜里交汇"的感觉——
一边,华为5月25日正式抛出"韬(τ)定律",这是中国在半导体领域第一次自己给出一套产业级"定律"叙事,不是追赶某条曲线的修补,而是试图重新定义曲线本身。寒武纪当天盘中摸到1435元,市值突破9000亿,整个算力链——从芯片到液冷到光模块——应声而动。
另一边,5月26日凌晨,开发者在OpenAI Codex后端日志里扒出了未发布的GPT-5.6(内部代号iris-alpha),最扎眼的数字是上下文窗口推到150万token,比GPT-5.5的105万又抬了43%。而且极端测试证明,输入跑到90万token模型还能流畅响应。
表面上看,一个是国产算力阵营的"理论宣言",一个是硅谷大厂的"型号泄露"。但你如果把这两件事跟最近另一条不太起眼的消息——面壁智能×清华在华为昇腾上跑通并开源了1.58-bit三值大模型BitCPM-CANN——叠在一起看,一幅更大的图就浮出来了:
AI产业的竞争重心,正在从"谁的模型参数大"不可逆地迁移到"谁的推理栈便宜、密、稳"。
换句人话:上半场卷训练,下半场卷推理;上半场卷模型,下半场卷算力底座。
一、"τ定律"不是一颗新芯片,是一套重新定价逻辑
先说华为这条线。
5月25日,华为在业界抛出"韬(τ)定律"——这是中国在全球半导体领域首次提出指导产业发展的全新原则,核心指向一个事实:当AI算力需求增长速度远超摩尔定律能兜底的范围,单靠"挤晶体管"已经走不通了,必须用体系级创新(互联、存储、软硬协同、能效比)把整台机器的有效算力榨出来。
同一时间段内,华为其实还干了另一件更"实"的事:
- 5月25日,何庭波在ISCAS 2026上确认:今年秋季面世的麒麟手机芯片将率先采用逻辑折叠技术,性能大幅提升。
- 5月22日,华为发布AIDC数据基础设施全栈方案——涵盖OceanStor Pacific全闪分布式存储、上下文记忆存储CMS(业界首个支持异构算力的PB级共享KV Cache方案)、ModelEngine Nexent智能体平台。这个CMS本质上就是在解决一个非常"下半场"的问题:超大规模推理集群里,怎么让context不反复重算、不让显存炸、不让电费吃掉毛利
翻译成码农语言:τ定律的哲学是——当单点算力碰天花板,你得把总线、存储、调度、编译全都当成同一个问题的不同切口来优化。这不是一颗芯片的故事,是一条产业链的重组信号。
而市场用最直接的方式投票:寒武纪突破9000亿市值,算力板块密集调研,公募私募的问法已经从"你有没有AI概念"变成了"你的订单在哪、毛利能不能守住"。
A股牌桌上这条链的核心名字,老玩家都熟:寒武纪、海光信息、中科曙光、澜起科技、拓维信息、神州数码、四川长虹、软通动力——它们不一定都"做芯片",但它们都在τ定律描述的那个体系化链条里有自己的卡位点(训练板卡、推理卡、服务器整机、昇腾生态分销与集成、内存接口)。
再加上这两天算力网叙事升级——中国移动、中国联通、中国电信三大运营商已经开始推Token套餐试水C端算力运营——这意味着"算力"这个词正在从B端机房走向类水电煤的运营模型。
二、GPT-5.6泄露透露的真相:上下文150万,拼的不是炫技是"推理经济学"
再把镜头切回硅谷。
GPT-5.6的泄露信息里,150万token上下文是最抓眼球的。但码农视角的核心问题应该是另一个:
你要150万token干什么?
答案就在产业节奏里——Agent(智能体)。
当AI从"问答机"变成"能跑长任务的代理",上下文不再是"一篇长文章",而是整个工作流的轨迹:代码仓库快照 + 工具调用历史 + 多轮调试日志 + 环境状态。90万~150万token不是用来装小说,是用来装一整个工作会话的记忆。
而OpenAI之所以要把这个数往上顶,根本驱动力就一条:推理成本。上下文越长 → KV Cache越大 → 显存占用越凶 → 每次请求越贵。如果你不能把长上下文做得"便宜且稳",Agent就不可能规模化铺开。
所以GPT-5.6的工程含义是:它在逼整条供应链(NVLink/InfiniBand/高带宽内存/液冷)继续往上走。英伟达这边FY27Q1超预期,客户需求已经从"买GPU"转向"买交换+互联+全栈",Vera Rubin机柜三季度起批量交付——说白了就是机柜级算力商品化。
这就回到了τ定律那套逻辑:无论硅谷还是华系,大家殊途同归——下一阶段的壁垒不在谁的checkpoint更大,而在谁能把推理栈的单位成本压下去。
A股对应这条"推理侧"供给链的受益方向,硬件层绕不开:寒武纪、海光信息、澜起科技;互联与传输层绕不开光模块/CPO阵营里的光迅科技、剑桥科技;制造与封装端则锚在长电科技、华虹公司、中芯国际这条大线。
三、最容易被忽略的那条暗线:国产算力"闭环"终于跑通了
如果说华为τ定律是"宣言",GPT-5.6是"压力测试",那面壁智能×清华×OpenBMB开源BitCPM-CANN这件事,才是真正让国产算力派愿意长舒一口气的那块拼图。
几个关键信息:
- BitCPM-CANN是首个完全基于华为昇腾NPU端到端训练并开源的三值(1.58-bit)大模型
- 提供6倍显存优化——同样物理内存,服务能力密度翻几倍;
- 整个链路——最底层量化算子 → 量化感知训练算法 → 并行策略 → 训练框架——全在昇腾上原生完成,含0.5B/1B/3B/8B四个尺寸;
- 与同尺寸全精度逐一对标,性能不垮。
这句话的外行听感是"哦,又开源了个模型"。但内行的听感是:
国产NPU + 国产低比特训练框架 + 国产模型 = 第一次形成可复用的完整闭环。
为什么要压到1.58-bit?因为端侧和低成本的推理节点扛不起BF16/FP16的显存账单。1.58-bit的本质是把"每一次矩阵乘的信息密度"极限压榨——这跟τ定律的精神完全一致:当硬件的绝对天花板摆在那里,你赢在能把每瓦特、每GB、每个cycle的产出率做到多高。
这条暗线对应的A股映射,不是某一家公司"拥有"这个模型,而是昇腾生态的商业化兑现路径变清晰了:拓维信息、软通动力、神州数码、四川长虹这些在昇腾整机、分销、行业落地侧的玩家,其估值锚正在从"概念溢价"往"出货量×毛利率"迁移。
四、把它们拧在一起:AI从"炼丹"期进入"电厂"期
码农财经一直用一个粗俗但管用的比喻区分AI的两个阶段:
- 炼丹期:谁的参数大、谁的榜高、谁的发布会炫,资本市场给想象——这是2023-2025的主旋律。
- 电厂期:算力变成一种要计量、要调度、要盈利的公共品。模型再强,token成本压不住就等于没有商业闭环。这时候赢家是能把"每token成本"持续往下拉的人——靠芯片架构、靠互联拓扑、靠KV Cache存储、靠低比特量化、靠液冷降PUE、靠调度系统少浪费一张卡。
华为τ定律是电厂期的理论旗帜;
GPT-5.6的150万token是电厂期的需求拉绳——Agent越长越复杂,推理账单越逼你升级基础设施;
BitCPM-CANN是国产路线的技术验收单——昇腾不再只是"能用",而是开始有原生、极致、可开源复现的闭环证据。
三者发生在同一周,不是巧合,是产业时钟走到同一个刻度了。
五、码农的仓位思考:别追烟花,追水管
这两天盘面如果你只看热闹:寒武纪新高、算力链脉冲、CPO弹一下又回落——很容易觉得"又在炒概念"。
但如果你拆清楚上面那张因果网,结论反而朴素:
- 算力芯片与体系:寒武纪、海光信息、中科曙光、澜起科技——它们值不值现在的价?不看情绪看一件事:国产训练+推理卡的出货量斜率生态锁定性
- 昇腾生态落地侧:拓维信息、软通动力、神州数码、四川长虹——盯的不是口号,是政企+运营商侧的实际交付规模。
- 传输与冷却:光迅科技、剑桥科技、以及相关液冷/PCB链条——τ定律式体系创新里,互联带宽是隐形瓶颈,谁有货谁说话。
- 运营商算力运营:中国移动、中国联通、中国电信——Token套餐只是试水,一旦算力网被真正确立为国家级基础设施定位(年投入规模有望破万亿量级叙事),它们的角色会从"管道"变成"电厂"。
最后一句直话:τ定律也好、GPT-5.6也罢,本质都在说同一件事——AI这场仗打到现在,模型层面的"惊喜边际"在递减,算力层面的"成本生死线"在递增。谁能在单位token上更便宜、更稳、更大规模地交付,谁才握着下半场的底牌。
而对A股来说,市场终于开始做那件它一直该做的事:
不再为"AI"两个字付溢价,开始为"能出货的AI"付钱。
这才是9000亿寒武纪也好、τ定律引发的板块共振也好,真正值得你坐下来认真看一眼的原因。
(本文基于公开信息梳理分析,提及公司仅作产业逻辑阐述,不构成投资建议。市场有风险,决策需独立。)
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.