来源:市场资讯
(来源:21世纪经济报道)
21世纪经济报道记者 林典驰 深圳报道
当全球AI算力重心从训练加速转向推理,一场围绕性价比与能效的芯片战争正悄然爆发。
2025年以来,谷歌TPU v7高调锚定推理时代,英伟达重金整合Groq核心资产,行业共识已然形成:未来五到十年,推理芯片将主导AI的演进方向。在这场历史性窗口期中,中国企业能否凭借场景优势、工程创新与供应链韧性实现弯道超车?
2月3日,云天励飞(688343.SH)举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI推理芯片战略布局。
云天励飞董事长兼CEO陈宁表示,公司将核心研发资源集中于攻克大模型落地的“成本壁垒”,致力于通过底层架构创新,力争实现百万 Tokens 推理成本降低 100 倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。
过去一年,全球算力产业风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化。
这一阶段的核心需求,已不再是依赖GPU、CUDA生态以及由数十万乃至百万张高性能计算卡互联所构建的“绝对算力”,而是转向对高性价比推理芯片的迫切需求。
陈宁表示,未来5~10年,将是AI推理芯片的高光时刻。行业的深刻变革、技术演进的趋势,以及时代赋予的历史性机遇,共同构成了我们在2025年坚定聚焦AI大算力推理芯片的战略驱动力。
过去一年多,无论是谷歌Gemini,还是字节跳动的豆包等大模型,其单模型对算力的需求,尤其是处理的Token数量,已呈数百倍增长。这些激增的Token,正如第四次工业革命中的“电”与“水”,已成为真正的核心生产力。而支撑如此海量Token处理的关键,并非训练(Training),而是推理(Inference)。
值得注意的是,就在上个月,英伟达以200亿美元的代价,虽未正式收购,但实质上整合了Groq最核心的资产。Groq由前谷歌TPU核心团队创立,英伟达通过引入其创始团队、核心技术人员,并获得其IP的永久授权,完成了这场战略性布局。
Groq的市值变化极具代表性,过去三年增长约7倍;而仅在2025年9月至2026年1月这短短四个月内,其估值便从70亿美元飙升至200亿美元,再度增长近3倍,增速甚至超越了英伟达自身。这一现象背后,折射出一个关键趋势:推理芯片的增长早已悄然超越训练芯片。未来的世界,属于推理芯片。
正因如此,云天励飞在2025年果断将芯片战略全面聚焦于云端大算力、大模型专用的推理芯片。无论是手机中的豆包助手、智能耳机里的实时同声传译,还是AR眼镜中驱动的AI模型,其核心诉求都是成本、效率与市场经济学,即每个Token背后的推理成本必须持续下降。
陈宁谈到,“我们的目标是:每年将百万Token的推理成本降低100倍,到2030年实现‘百亿Token仅需一分钱人民币’。唯有达到这一成本水平,AI才能真正引爆一场普惠性的工业革命。”
中国在AI应用场景的丰富度与落地速度上已全球领先,基础设施建设能力更是世界最强。然而,在模型层与芯片层,中国仍相对落后。但这也意味着巨大的追赶与超越空间。只要补齐模型与芯片这两块关键拼图,中国完全有能力引领第四次工业革命。
回顾过去十年,是AI训练芯片的时代。
陈宁认为,客观而言,在训练领域,GPU与CUDA生态已由英伟达确立为全球事实标准,短期内难以撼动。但在推理芯片领域,格局尚未成型,谷歌TPU v7、Groq等新兴架构刚刚崭露头角,这为中国企业提供了历史性窗口。
因此,陈宁谈到,中国应在训练芯片领域持续追赶,确保差距不被进一步拉大;在推理芯片领域全力超车,依托中国丰富的应用场景、强大的电网与基建能力,以及蓬勃发展的开源模型生态,实现弯道超车。
也正是基于这一判断,云天励飞正在打造专为大模型推理优化的新型处理器架构GPNPU,并提出了“GPNPU= GPGPU+NPU+3D堆叠存储”的核心公式,旨在兼顾通用计算的通用性与 NPU 的高效性,在工程层面同时解决可迁移、可部署、可持续降本三大难题。
在通用生态层面,鉴于 CUDA 仍是全球最成熟、覆盖最广的加速计算平台之一,云天励飞的 GPNPU 架构致力于正视主流生态的迁移成本问题,能够实现一行代码完成 CUDA 程序兼容,极大降低了进入生产系统的门槛。
在推理能效层面,NPU 能够实现更高的计算效率和能效比,面对大模型推理这种高度结构化、可被体系化优化的负载,专用化设计带来的能效优势更容易转化为真实成本优势,这也是国际厂商持续加码专用路线的重要原因。
同时,针对行业公认的“内存墙”瓶颈,云天励飞正深度研发 3D 堆叠存储及更前沿的互连技术,以提升带宽与能效,降低推理时延。
在架构工程与产品化路径上,云天励飞采用“算力积木”架构,即通过 Chiplet 扩展与互连思路,将标准计算单元进行模块化封装与组合,让算力像搭积木一样按需扩展,形成从边缘到更大规模推理的弹性产品形态。
陈宁称,未来五年,云天励飞将全力打磨并推广DeepVerse 100、200、300系列芯片,覆盖互联网、通信运营商及各行业头部客户。这不仅是我们技术路线的落地体现,更将驱动公司营收进入高速增长通道。
而支撑公司跨越周期的,是长期积累构筑的商业护城河。陈宁将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,将是云天励飞应对行业激烈竞争的底气。
针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO 兼董秘邓浩然谈到,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为后续芯片的大规模量产与交付提供了确定性。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.