网易首页 > 网易号 > 正文 申请入驻

云天励飞发布未来三年算力芯片战略:聚焦推理效能升级,全线对标英伟达新一代产品

0
分享至

雷峰网消息,2月3日,云天励飞首次对外公布未来三年的大算力AI推理芯片战略布局,将实现百万Tokens推理成本降低100倍以上的目标。

推理算力需求暴涨,是在行业中实际发生的结构性变革。

德勤发布的报告指出2026年推理算力将占整体AI算力的66%,推理优化芯片市场在2026年将增长至超500亿美元。字节旗下豆包大模型Token使用量从2024年的单日0.12万亿,到2025年12月已突破50万亿。

多个行业信号共同指向一个趋势:推理侧竞争已不再单纯是“把模型做得更强”的参数竞赛,而是“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率已成为规模化落地的最大门槛。

“在推理芯片领域,依托国内丰富的应用场景、稳定可靠的电网和快速迭代的开源模型,我们具备弯道超车的能力,因此训练追赶、推理超车是未来5年我们的策略,而GPNPU则是AI推理芯片架构的最优解。”云天励飞董事长兼CEO表示。


面向AI推理需求的爆发式增长,云天励飞如何规划下一阶段芯片研发路线图?又将如何通过架构创新与技术突破,真正实现算力效率提升与全生命周期成本下降,从而在推理芯片领域实现弯道超车?

GPNPU架构定义未来三年芯片路线:直指英伟达旗舰级算力产品

推理时代的胜负手不在单点指标,而在系统级协同:既要承接主流软件生态,又要在推理负载下实现更优能效与更低时延。

云天励飞确立了GPNPU技术路线,并提出了“GPNPU=GPGPU+NPU+3D堆叠存储”的核心公式,兼顾通用计算的“通用性”与NPU的“高效性”。


在通用生态层面,鉴于CUDA仍是全球最成熟、覆盖最广的加速计算平台之一,云天励飞的GPNPU架构致力于正视主流生态的迁移成本问题,能够实现一行代码完成CUDA程序兼容,极大降低了进入生产系统的门槛。

在推理能效层面,NPU能够实现更高的计算效率和能效比,面对大模型推理这种高度结构化、可被体系化优化的负载,专用化设计带来的能效优势更容易转化为真实成本优势,这也是国际厂商持续加码专用路线的重要原因。

同时,针对行业公认的“内存墙”瓶颈,云天励飞正深度研发 3D 堆叠存储及更前沿的互连技术,以提升带宽与能效,降低推理时延。

“通过引入3D memory架构,我们可以实现10倍于当前训练芯片HBM带宽的性能,其访问时延将达到10纳秒级别,以实现极致的推理能效。”云天励飞CTO李爱军表示。

在架构工程与产品化路径上,云天励飞提出“算力积木”架构,通过Chiplet扩展与互连思路,将标准计算单元进行模块化封装与组合,让算力像搭积木一样按需扩展,形成从边缘到更大规模推理的弹性产品形态。

其次是面向推理的系统级优化能力,公司拒绝单纯的“芯片参数竞赛”,而是主张把“模型怎么跑得更省”沉淀到架构里,围绕真实业务负载持续迭代,逐项击穿推理链路中的成本与时延瓶颈,最终形成可复制交付的解决方案。

“基于对大模型推理的理解,我们构造了PD分离系统架构,针对大模型prefill和decode阶段不同的计算特点进行优化设计,在芯片的微架构层面上,我们同时对于Attention及FFN的计算的特点进行细粒度的分析,从而进一步的去提升我们的推理效率。”李爱军说到。


会议上,云天励飞以推进百万Token推理成本每年两位数的降低为目标,正式发布了未来三年的大算力芯片规划。

2026至2028年,云天励飞规划推出三代迭代芯片,节奏清晰对标国际主流厂商。

第一代超节点P芯片将于今年推出,其将面向百万长上下文的场景进行极致的prefill推理优化,在算力上紧跟H100。

2027年,云天励飞将研发第一代超节点D芯片,以此在decode推理方面实现超低延时,而其算力性能将达到B200 相当的水平。

2028年,云天励飞将研发第二代超节点D芯片,致力于实现毫秒级的推理时延,从而使得prefill和decode的性能大幅提升,在算力层面,将对标英伟达的下一代Rubin芯片。


手握「充足」国产产能,云天励飞打通研发、量产与规模化交付闭环

算力芯片的竞争已步入新周期,多家公司登陆资本市场之外,还有大量创业公司逐渐崭露头角。

竞争白热化的行业境况下,陈宁指出,支撑公司跨越周期的,是长期积累构筑的商业护城河。云天励飞的核心竞争力,已形成技术、产能、生态、市场、资本五大维度的协同。

GPNPU的架构创新,以及三年大算力芯片规划的发布,实现了技术与产品的闭环。

在此之下,产能成为落地的关键。

针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO兼董秘邓浩然特别强调,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为后续芯片的大规模量产与交付提供了极高的确定性。

此外,云天励飞受到资本市场的高度关注,具备足够的资金实力以支撑芯片研发的长期消耗,同时在顶级芯片人才的招揽上,也能够走在前列。


而为了应对市场竞争以及不确定性,云天励飞更将组织调整为更具韧性的“1+4”架构。

“1”指聚焦于AI大算力推理芯片,“4”则是四大事业部。作为生态构建者,四大事业部旨在解决芯片从“研发生产、优化打磨到市场推广”的核心难题。其中,政企事业部作为基石,将凭借深厚的行业经验,将战略重点转向推理设备和智算中心的建设,以实现业务运转的协同闭环。

据悉,云天励飞正规划打造区域级“千卡集群”。


推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI才能从“看得见的能力”走向“用得起的生产力”。

未来,云天励飞将以GPNPU架构为核心,大力推进云端大算力强化软硬协同与存储体系攻坚,实现百万Tokens推理成本降低超100倍的目标。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
忍无可忍强势回击!伊朗一刀封喉致命,以色列真正的“麻烦”来了

忍无可忍强势回击!伊朗一刀封喉致命,以色列真正的“麻烦”来了

阿器谈史
2026-03-23 03:34:40
伊朗,七寸被掐住了

伊朗,七寸被掐住了

深度报
2026-03-22 22:19:20
克林顿前幕僚曝光白宫秘辛:人人厌恶希拉里,无人敢与她交谈

克林顿前幕僚曝光白宫秘辛:人人厌恶希拉里,无人敢与她交谈

春日在捕月
2026-03-19 02:51:42
郑则仕辟谣“跑步9个月减重70斤”:四五年的时间慢慢减下来的

郑则仕辟谣“跑步9个月减重70斤”:四五年的时间慢慢减下来的

韩小娱
2026-03-20 10:44:39
49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

查尔菲的笔记
2026-03-16 19:12:07
伊朗称在南部沿海拦截一架F-15战机

伊朗称在南部沿海拦截一架F-15战机

界面新闻
2026-03-22 17:30:08
奥运冠军“拉拉链露胸”,让耐克绷不住了!

奥运冠军“拉拉链露胸”,让耐克绷不住了!

品牌营销报
2026-02-23 11:31:10
川普给伊朗下最后通牒,海湾国家全面倒戈

川普给伊朗下最后通牒,海湾国家全面倒戈

难得君
2026-03-22 10:53:27
不包机了!国足直飞悉尼票价曝光:低于7千,国脚坐10小时经济舱

不包机了!国足直飞悉尼票价曝光:低于7千,国脚坐10小时经济舱

侃球熊弟
2026-03-23 01:05:03
俄罗斯让中国心寒?比西方围堵更恐怖的,是我们看轻了自己的实力

俄罗斯让中国心寒?比西方围堵更恐怖的,是我们看轻了自己的实力

近史博览
2026-03-19 12:49:45
驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

睡前讲故事
2026-02-03 20:55:43
伊朗发行面值1000万里亚尔的纸币,这是该国历史上面值最大的钞票

伊朗发行面值1000万里亚尔的纸币,这是该国历史上面值最大的钞票

山河路口
2026-03-21 23:19:21
王道席任湖南省政府常务副省长、党组副书记

王道席任湖南省政府常务副省长、党组副书记

中国经济网
2026-03-22 16:36:03
比白发更可怕的是“中国式大爷发型”,自以为时髦,实际油腻土气

比白发更可怕的是“中国式大爷发型”,自以为时髦,实际油腻土气

淡淡稻花香s
2026-03-19 03:53:49
1.5T!奔驰官宣:新车正式亮相

1.5T!奔驰官宣:新车正式亮相

高科技爱好者
2026-03-22 23:05:42
泰山0-4不敌玉昆!徐亮赛后犀利点评,一针见血,直指惨败根源!

泰山0-4不敌玉昆!徐亮赛后犀利点评,一针见血,直指惨败根源!

田先生篮球
2026-03-22 06:24:40
最殷勤和最坏的男人!1985年阳高县“7·22”离奇谋杀案侦破始末

最殷勤和最坏的男人!1985年阳高县“7·22”离奇谋杀案侦破始末

路之意
2026-03-22 04:47:09
后半生的人生赢家吴绮莉,大女儿吴卓林27岁了,小儿子才12岁

后半生的人生赢家吴绮莉,大女儿吴卓林27岁了,小儿子才12岁

阿讯说天下
2026-03-20 15:24:35
关于杨兰兰,我们可能永远不知道她是谁?很多帖子已被抹去

关于杨兰兰,我们可能永远不知道她是谁?很多帖子已被抹去

麦大人
2025-09-09 15:15:02
科技媒体评黄天鹅鸡蛋:饲料中加角黄素就可以稳定把蛋黄变成橙色

科技媒体评黄天鹅鸡蛋:饲料中加角黄素就可以稳定把蛋黄变成橙色

映射生活的身影
2026-03-21 15:52:35
2026-03-23 06:36:49
雷峰网 incentive-icons
雷峰网
关注智能与未来!
68801文章数 656095关注度
往期回顾 全部

科技要闻

嫌台积电太慢 马斯克要把芯片产能飙升50倍

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

47岁“国际章”身材走样?让嘲笑她的人闭嘴

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

亲子
艺术
数码
家居
公开课

亲子要闻

孩子无意中说这样的话,可能隐藏求救信号,宝妈们要警惕!

艺术要闻

乾隆皇帝的 “私密日记”

数码要闻

古尔曼:苹果Apple TV、HomePod和HomePod mini库存告急

家居要闻

时空交织 空间绮梦

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版