网易首页 > 网易号 > 正文 申请入驻

华为发布AI推理新技术 将于今年9月正式开源

0
分享至

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分析也好,都会涉及到非常多的长序列输入。“比如一份投研报告就是上兆级别,精准营销所需要输入的上下文也是长序列,所以推不动这个问题经常出现。其次是推得慢的问题,核心就是并发上不去,上去之后每Token时延特别长。另外推得贵,原因是需要耗费大量的算力。”

华为数据存储产品线AI存储首席架构师李国杰进一步解释,不管是行业调研报告、公司财务信息以及其他公开信息,都是超长上下文的多源信息汇聚。随着迈向Agentic AI(代理式AI),这些信息会拆成很多步,逐步地深度挖掘,最终给出一个专业的趋势判断和报告。这对显存、计算量都会有很大的压力。

推理体验和推理成本,将成为未来AI行业化落地的一大阻碍。“到了Agentic AI时代,Token消费相比以前是百万级的,成本过高意味着落地就没有了一个基本的前提,没有人用得起。”谢黎明称。

谈及AI的发展趋势,李国杰认为,模型智能转向数据智能,这在专业领域已基本成为共识。未来,华为会基于UCM构筑更多的Agentic AI能力,以及多模检索和数据湖的能力等等。

“从GPT5的发布可以看到,传统的Scaling Law模式已经遇到瓶颈。从应用需求的角度来讲,客户开始关注AI的商业循环和商业变现,更关注体验。从技术驱动的角度,当模型的智能水平遇到瓶颈,会系统化地转向数据智能。因为其本质原因是缺少高质量数据,大量用AI合成数据、数据荒以及数据质量的问题,都会成为新的产业研究焦点。”

华为计划于今年9月份开源UCM,目前已有讯飞等生态伙伴加入。李国杰透露,“很多政府行业、金融行业、制造行业等客户,已经使用起来。我们会与更多的基础设施和生态伙伴一起共建,也会与更多具有非常典型性或者行业性的客户,一起共建。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
古二新录音曝出捞人者背景和名字,但警方通报却显示,没有捞人者

古二新录音曝出捞人者背景和名字,但警方通报却显示,没有捞人者

芊手若
2025-11-12 00:33:22
中国人玩阳谋多牛?中储粮以一敌四,戏耍国际四大粮食商!

中国人玩阳谋多牛?中储粮以一敌四,戏耍国际四大粮食商!

遇见洞见
2025-11-10 20:20:03
1976年她的墓葬出土,证明不是神话人物,而是真实存在的

1976年她的墓葬出土,证明不是神话人物,而是真实存在的

老呶侃史
2025-11-10 16:25:57
为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

带你感受人间冷暖
2025-11-04 16:38:29
高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

临云史策
2025-11-11 22:00:26
“威龙收到,已与玄龙协同”,空军首次发布重磅画面!专家:“三剑客”亮相

“威龙收到,已与玄龙协同”,空军首次发布重磅画面!专家:“三剑客”亮相

政知新媒体
2025-11-11 20:13:21
亚洲第一!中超再添2座:未来有望增至13座专业足球场!

亚洲第一!中超再添2座:未来有望增至13座专业足球场!

邱泽云
2025-11-11 14:09:31
美媒彻底懵了:一张40%电费单,撕开美国锁死7nm芯片的真相!AI决战我们早已换道超车,赢在第二起跑线

美媒彻底懵了:一张40%电费单,撕开美国锁死7nm芯片的真相!AI决战我们早已换道超车,赢在第二起跑线

打破砂锅看本质
2025-11-10 12:04:32
镜报:买安德森要1亿-1.2亿镑,曼联可能通过出售5人筹集资金

镜报:买安德森要1亿-1.2亿镑,曼联可能通过出售5人筹集资金

懂球帝
2025-11-12 00:45:05
北京这晚,郭晶晶用凸起的“小肚子”,给内娱审美上了生动的一课

北京这晚,郭晶晶用凸起的“小肚子”,给内娱审美上了生动的一课

娱乐圈笔娱君
2025-11-11 16:06:53
李连杰最近逆生长,容颜从老到年轻给普通人哪些启示,放松很重要

李连杰最近逆生长,容颜从老到年轻给普通人哪些启示,放松很重要

呼吸科大夫胡洋
2025-11-09 13:10:15
网友吐槽:进了一批新国标电动车,根本没人买,又是赔本的生意

网友吐槽:进了一批新国标电动车,根本没人买,又是赔本的生意

你食不食油饼
2025-11-11 06:00:03
吃晚饭时,长期喝二三两白酒的人,最后身体都怎样了?告诉你真相

吃晚饭时,长期喝二三两白酒的人,最后身体都怎样了?告诉你真相

涵豆说娱
2025-11-11 14:10:27
王清海教授:陈皮和它是绝配!常喝血脂降了,斑块没了,血管通了

王清海教授:陈皮和它是绝配!常喝血脂降了,斑块没了,血管通了

蜡笔小小子
2025-11-08 14:18:03
红军村战役结束了,俄军大规模进城,乌军反攻不知道去了哪里

红军村战役结束了,俄军大规模进城,乌军反攻不知道去了哪里

坚果甜瓜
2025-11-11 20:09:28
著名投资家段永平向北京师范大学捐赠2.2亿元!北师大将将理工综合体图书馆冠名为“彭建华图书馆”,彭建华为段永平母亲

著名投资家段永平向北京师范大学捐赠2.2亿元!北师大将将理工综合体图书馆冠名为“彭建华图书馆”,彭建华为段永平母亲

和讯网
2025-11-11 16:10:55
“野人小孩”真相大揭秘,竟然是这样的家庭状况

“野人小孩”真相大揭秘,竟然是这样的家庭状况

寒士之言本尊
2025-11-11 23:57:14
王栎鑫为女儿庆生,正式告诉儿女离婚

王栎鑫为女儿庆生,正式告诉儿女离婚

锋哥与八卦哥
2025-11-11 13:13:00
女子高铁堵道后续:知情人透原因,女子正脸被扒黑皮胖脸,已社死

女子高铁堵道后续:知情人透原因,女子正脸被扒黑皮胖脸,已社死

奇葩游戏酱
2025-11-11 13:46:39
十年一梦!曝瓜帅明夏将离开曼城:最亲密战友已离队 3继任者曝光

十年一梦!曝瓜帅明夏将离开曼城:最亲密战友已离队 3继任者曝光

风过乡
2025-11-11 18:09:41
2025-11-12 03:40:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
647159文章数 1015469关注度
往期回顾 全部

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

头条要闻

携6.1万枚比特币出逃英国 富婆奢靡生活披露

头条要闻

携6.1万枚比特币出逃英国 富婆奢靡生活披露

体育要闻

一个14岁的小男孩,决定了谁能晋级世界杯

娱乐要闻

古二曝秦雯多次炫耀袭警经历

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

本地
旅游
时尚
教育
公开课

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

旅游要闻

“萌狮叫醒”服务是跑偏的文旅创新

舒淇,东亚女孩的恨海情天

教育要闻

老师们不奢望减轻什么负担,只希望能实行8小时工作制!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版