网易首页 > 网易号 > 正文 申请入驻

3.91倍T4实测性能提升!鲲云科技发布全球首款数据流AI芯片

0
分享至

6月23日,鲲云科技在深圳举行产品发布会,发布全球首款数据流AI芯片CAISA。该款芯片定位于高性能AI推理,目前已完成量产。

鲲云科技是一家高性能人工智能芯片公司,由数据流定制计算领域院士的团队创立,致力于提供下一代人工智能计算平台,加速人工智能落地。此次,鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6倍。第三方测试数据显示,仅用1/3的峰值算力,CAISA芯片可以实现英伟达同类产品最高3.91倍的实测性能。鲲云科技的定制数据流技术不依靠更大的芯片面积和制程工艺,而是通过数据流动控制计算顺序来提升实测性能,为用户提供了更高的算力性价比。

鲲云科技创始人兼CEO牛昕宇博士发布数据流CAISA芯片

超高芯片利用率,完成3.0升级

此次发布的CAISA芯片采用鲲云自研的定制数据流芯片架构CAISA 3.0。相较于上一代芯片架构,CAISA3.0在架构效率和实测性能方面有了大幅的提升,并在算子支持上更加具有通用性,支持绝大多数神经网络模型快速实现检测、分类和语义分割部署。CAISA3.0在多引擎支持上提供了4倍更高的并行度选择,大大提高了架构的可拓展性。在AI芯片内,每一个CAISA都可以同时处理AI工作负载,进一步提升了CAISA架构的性能,在峰值算力提升6倍的同时,保持了高达95.4%的芯片利用率,提升了实测性能线性。同时,新一代CAISA架构对编译器RainBuilder的支持更加友好,软硬件协作进一步优化,在系统级别上为用户提供了更好的端到端性能。

CAISA3.0架构图

CAISA3.0架构继续保持在数据流技术路线的全球领先地位,指令集架构采用冯诺依曼计算方式,通过指令执行次序控制计算顺序,并通过分离数据搬运与数据计算提供计算通用性。CAISA架构依托数据流流动次序控制计算次序,采用计算流和数据流重叠运行方式消除空闲计算单元,并采用动态配置方式保证对于人工智能算法的通用支持,突破指令集技术对于芯片算力的限制。此次升级,CAISA架构解决了数据流架构作为人工智能计算平台的三大核心挑战:

1. 高算力性价比:在保持计算正确前提下,通过不断压缩每个空闲时钟推高芯片实测性能以接近芯片物理极限,让芯片内的每个时钟、每个计算单元都在执行有效计算;

2. 高架构通用性:在保证每个算法在CAISA上运行能够实现高芯片利用率的同时,CAISA3.0架构通用支持所有主流CNN算法;

3. 高软件易用性:通过专为CAISA定制的编译工具链实现算法端到端自动部署,用户无需底层数据流架构背景知识,简单两步即可实现算法迁移和部署,降低使用门槛。

具体来讲,鲲云CAISA3.0架构的三大技术突破主要通过以下的技术方式实现:

1. 高算力性价比:时钟级准确的计算

CAISA3.0架构由数据流来驱动计算过程,无指令操作,可以实现时钟级准确的计算,最大限度的减少硬件计算资源的空闲时间。CAISA3.0架构通过数据计算与数据流动的重叠,压缩计算资源的每一个空闲时钟;通过算力资源的动态平衡,消除流水线的性能瓶颈;通过数据流的时空映射,最大化复用芯片内的数据流带宽,减少对外部存储带宽的需求。上述设计使CNN算法的计算数据在CAISA3.0内可以实现不间断的持续运算,最高可实现95.4%的芯片利用率,在同等峰值算力条件下,可获得相对于GPU 3倍以上的实测算力,从而为用户提供更高的算力性价比。

2. 高架构通用性:流水线动态重组

CAISA3.0架构可以通过流水线动态重组实现对不同深度学习算法的高性能支持。通过CAISA架构层的数据流引擎、全局数据流网、全局数据流缓存,以及数据流引擎内部的人工智能算子模块、局部数据流网、局部数据流缓存的分层设计,在数据流配置器控制下,CAISA架构中的数据流连接关系和运行状态都可以被自动化动态配置,从而生成面向不同AI算法的高性能定制化流水线。在保证高性能的前提下,支持用户使用基于CAISA3.0架构的计算平台实现如目标检测、分类及语义分割等广泛的人工智能算法应用。

3. 高软件易用性:算法端到端自动化部署

RainBuilder编译工具链

专为CAISA3.0架构配备的RainBuilder编译工具链支持从算法到芯片的端到端自动化部署,用户和开发者无需了解架构的底层硬件配置,简单两步即可实现算法快速迁移和部署。RainBuilder编译器可自动提取主流AI开发框架(TensorFlow、Caffe、Pytorch、ONNX等)中开发的深度学习算法的网络结构和参数信息,并面向CAISA结构进行优化;工具链中的运行时(Runtime)和驱动(Driver)模块负责硬件管理并为用户提供标准的API接口,运行时可以基于精确的CAISA性能模型,实现算法向CAISA架构的自动化映射,同时提供可以被高级语言直接调用的API接口;最底层的驱动可以实现对用户透明的硬件控制。RainBuilder工具链使用简单,部署方便,通用性强,可以让用户快速和低成本的部署和迁移已有算法到CAISA硬件平台上。

首款量产数据流AI芯片,带来研发新方向

CAISA-定制数据流AI芯片

作为全球首款采用数据流技术的AI芯片,CAISA搭载了四个CAISA3.0引擎,具有超过1.6万个MAC(乘累加)单元,峰值性能可达10.9TOPs。该芯片采用28nm工艺,通过PCIe3.0×4接口与主处理器通信,同时具有双DDR通道,可为每个CAISA引擎提供超过340Gbps的带宽。

CAISA芯片架构图

作为一款面向边缘和云端推理的人工智能芯片,CAISA可实现最高95.4%的芯片利用率,为客户提供更高的算力性价比。CAISA芯片具有良好的通用性,可支持所有常用AI算子,通过数据流网络中算子的不同配置和组合,CAISA芯片可支持绝大多数的CNN算法。针对CAISA芯片,鲲云提供RainBuilder3.0工具链,可实现推理模型在芯片上的端到端部署,使软件工程师可以方便的完成CAISA芯片在AI应用系统中的集成。

高算力性价比的AI计算平台

发布会上,鲲云科技创始人兼CEO牛昕宇博士还发布了基于CAISA芯片的星空系列边缘和数据中心计算平台——X3加速卡和X9加速卡,并公布了包括ResNet-50、YOLO v3等在内的主流深度学习网络的实测性能。

星空X3加速卡发布

星空X3加速卡是搭载单颗CAISA 芯片的数据流架构深度学习推断计算平台,为工业级半高半长单槽规格的PCIe板卡。得益于其轻量化的规格特点,X3加速卡可以与不同类型的计算机设备进行适配,包括个人电脑、工业计算机、网络视频录像机、工作站、服务器等,满足边缘和高性能场景中的AI计算需求。相较于英伟达边缘端旗舰产品Xavier,X3可实现1.48-4.12倍的实测性能提升。

星空X9加速卡发布

星空X9加速卡为搭载4颗CAISA 芯片的深度学习推断板卡,峰值性能43.6TOPS,主要满足高性能场景下的AI计算需求。同英伟达旗舰产品T4相对,X9在ResNet-50、YOLO v3等模型上的芯片利用率提升2.84-11.64倍。在实测性能方面,X9在ResNet50可达5240FPS,与T4性能接近,在YOLO v3、UNet Industrial等检测分割网络,实测性能相较T4有1.83-3.91倍性能提升。在达到最优实测性能下,X9处理延时相比于T4降低1.83-32倍。实测性能以及处理延时的大幅领先,让数据流架构为AI芯片的发展提供了提升峰值性能之外的另一条技术路线。

鲲云科技通过CAISA数据流架构提高芯片利用率,同样的实测性能,对芯片峰值算力的要求可大幅降低3-10倍,从而降低芯片的制造成本,为客户提供更高的算力性价比。目前,星空X3加速卡已经实现量产,星空X9加速卡将于今年8月推出市场。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏入梅,有消息了!

江苏入梅,有消息了!

城市日历
2026-05-30 21:04:23
为什么去过朝鲜回来就沉默的人,不是隐瞒,是真的说不出

为什么去过朝鲜回来就沉默的人,不是隐瞒,是真的说不出

老特有话说
2026-05-12 15:41:08
励志!方媛原来是个安徽农家女,曾在上海做过导购,母亲还曾失业

励志!方媛原来是个安徽农家女,曾在上海做过导购,母亲还曾失业

魔都姐姐杂谈
2026-05-19 08:58:40
王毅访问刚结束,加拿大民众却怒了:卡尼总理,你到底站哪边?

王毅访问刚结束,加拿大民众却怒了:卡尼总理,你到底站哪边?

凉湫瑾言
2026-05-30 16:13:29
争议!德比斯仅获第8后遭网友嘲讽 车队被批:你们不看天气预报?

争议!德比斯仅获第8后遭网友嘲讽 车队被批:你们不看天气预报?

风过乡
2026-05-31 08:04:14
泽连斯基做梦没料到,先等来的不是俄军打基辅,中方突然划下红线

泽连斯基做梦没料到,先等来的不是俄军打基辅,中方突然划下红线

史智文道
2026-05-31 09:33:04
电车,是时候交养路费了

电车,是时候交养路费了

第一财经资讯
2026-05-29 10:11:25
既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

安安说
2026-02-01 14:01:51
郝军辉任中央组织部副部长

郝军辉任中央组织部副部长

中国经济网
2026-05-30 14:23:25
1夜4大转会:利物浦敲定新帅,巴萨截胡马竞,米兰签约英超教头!

1夜4大转会:利物浦敲定新帅,巴萨截胡马竞,米兰签约英超教头!

田先生篮球
2026-05-31 09:49:40
国家电网与南方电网举行会谈

国家电网与南方电网举行会谈

界面新闻
2026-05-30 12:22:23
日本实施史上最大规模外汇干预行动

日本实施史上最大规模外汇干预行动

参考消息
2026-05-30 21:21:08
荷兰军官:我们进入南海,遇到了解放军,他们没说这里是他们领土

荷兰军官:我们进入南海,遇到了解放军,他们没说这里是他们领土

阿龙聊军事
2026-05-28 15:58:13
再创历史!巴黎逆转夺得欧冠冠军 打破尘封8年纪录!姆总尴尬了

再创历史!巴黎逆转夺得欧冠冠军 打破尘封8年纪录!姆总尴尬了

阿讯说天下
2026-05-31 10:31:00
1800万人的“深圳梦”稳了!国务院发文:人在哪,家就在哪!

1800万人的“深圳梦”稳了!国务院发文:人在哪,家就在哪!

今日搞笑分享
2026-05-31 01:29:13
1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

1990年,作家三毛到新疆和76岁的王洛宾同居,王洛宾说:“可以同居,不可以发生关系!

犀利辣椒
2026-05-20 06:23:07
新华社下场,耿同学又抛出4条大鱼!

新华社下场,耿同学又抛出4条大鱼!

仕道
2026-05-30 09:52:28
演员肖旭被曝出轨,其宣布结婚当天,前女友石蕊发文控诉:长达13年的感情,竟以“8年背叛”收场

演员肖旭被曝出轨,其宣布结婚当天,前女友石蕊发文控诉:长达13年的感情,竟以“8年背叛”收场

扬子晚报
2026-05-30 10:14:11
网购时要注意了,“旗舰店”和“官方店”一字之差,天壤地别!

网购时要注意了,“旗舰店”和“官方店”一字之差,天壤地别!

另子维爱读史
2026-05-25 07:55:09
白云山清理李楚源的又一“流毒”

白云山清理李楚源的又一“流毒”

健识局
2026-05-30 21:47:59
2026-05-31 10:51:00
雷克智能 incentive-icons
雷克智能
智能才是机器之道
1139文章数 5887关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

稻城亚丁景区是否有权在省道上"设卡" 央媒调查

头条要闻

稻城亚丁景区是否有权在省道上"设卡" 央媒调查

体育要闻

巴黎再度捧起欧冠奖杯 枪手众将黯然神伤

娱乐要闻

贾玲最新动作!侯明昊给虞书欣抬轿!

财经要闻

字节跳动的 "一盘大棋"

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

房产
手机
游戏
亲子
军事航空

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

手机要闻

nova十周年大作!华为nova 16系列下周亮相:顶流代言+麒麟9系芯片

PS5独占《漫威金刚狼》售价曝光!疑似即将开启预购

亲子要闻

人能自私到什么地步?网友:把宝宝退烧药喝了,说孩子可以再生

军事要闻

美防长参加"香会" 就美中关系最新表态

无障碍浏览 进入关怀版