网易首页 > 网易号 > 正文 申请入驻

技术验证收官!寒武纪软件平台发力,国产AI算力打破垄断

0
分享至

中国AI芯片公司寒武纪的CambriconNeuWare基础软件平台,已经在大模型训练推理、搜广推这些核心场景完成了大规模技术验证。

这事儿可不是小打小闹,标志着这家公司从单纯卖芯片的硬件供应商,正式转向能提供完整AI解决方案的平台企业,转型之路迈出了关键一步。

现在AI圈的算力竞争早就变味儿了。



不再是比谁的芯片性能参数更亮眼,而是要看软硬件能不能协同发力,生态体系完不完善,大规模部署的时候稳不稳定。

寒武纪能走到这一步,靠的就是这些年一直坚持的训练推理融合和统一软件平台战略,显然是摸准了行业发展的脉搏。

底层技术打底,国产算力有了核心底气

寒武纪的软件平台能站稳脚跟,底层技术创新是绝对的核心支撑。



驱动和运行时库这块,业务能连续运行好几个月不关机,这种高稳定性在大规模商业部署里太重要了。

毕竟谁也不想训练一个大模型到关键时刻,突然因为系统崩溃前功尽弃。

本来以为调度吞吐率这种技术指标离实际应用很远,后来发现它直接影响处理速度。

寒武纪用细粒度并行技术,把内核函数调度吞吐提得很高,面对海量用户请求的高并发场景,也能稳稳扛住压力。



通信技术上的优化也很有针对性,针对DeepSeekV3这类混合专家模型,他们搞了类IBGDA接口,专门解决推理阶段的性能瓶颈。

资源管理还分了三种模式,visiblecluster能弹性拆分方便快速部署,sMLU支持容器化部署,MIM技术对标国际主流的MIG功能,不管是中小企业小范围试用,还是大型企业大规模集群部署,都能找到合适的方式。

编译器是AI软件的核心竞争力,寒武纪的BANGC语言专门针对自己的MLU芯片做了优化,支持多种高级编译技术,核心算子的效率已经达到业界领先水平。



而且他们还快速跟进开源社区的Triton标准,3.4版本的所有特性都能支持,部分热点算子的性能甚至能和手写算子相当,这就让开发者不用重新学习新的工具,模型迁移起来也顺畅多了。

技术再好,也得经过实际场景的检验。

寒武纪的软件平台到底好不好用,大模型训练和搜广推这些核心场景最有发言权,毕竟这些场景是AI技术商业化最关键的阵地。



场景验证通关,技术落地走出关键一步

搜广推场景每天要处理海量用户请求,还得在极短时间内给出精准结果,对算力平台的吞吐量、延迟和稳定性要求都特别高。

寒武纪的解决方案在这儿已经稳定运行好几个月,精度和稳定性都达到了商业要求,这就说明技术已经成熟到能落地赚钱了。

他们还针对Layernorm、RMSNorm这些常用算子做了优化,进一步提升了运行速度。



大模型训练方面,不管是DeepSeekV3/V3.1、Qwen2.5/Qwen3这些热门的混合专家模型,还是GLM4.5、Flux、Hunyuan-Video这类多模态模型,寒武纪的平台都能支持。

而且还搞了FP8低精度训练,在保证精度的前提下,能帮企业省下不少算力成本,这在现在AI训练成本居高不下的情况下,吸引力确实不小。

推理场景的技术探索也没落下,新的W4A4、MX-FP8这些低比特数据类型,还有稀疏注意力、线性注意力这些高效机制都有适配。



连Qwen-Omni多模态融合模型、Hunyuan3D3D生成模型、CosyVoice语音生成模型这些新兴领域,平台也能支持。

特别是DeepSeekV3.2-Exp模型一发布,寒武纪马上就完成适配还开源了代码,这种快速响应能力,在竞争激烈的AI行业里很加分。

分布式通信是大规模训练的关键,寒武纪针对这个场景新增了HDR/DBT等Allreduce通信算法,提升了大规模部署时的通信带宽,Alltoall操作的扩展性也跟上了国际主流水平。



还加了在线打点、模块化日志这些可维可测功能,遇到通信错误或者异常卡死的问题,能快速找到原因,不用再靠人工一点点排查。

大规模部署不仅考验技术,还考验运维能力。

寒武纪显然想到了这一点,配套的生态工具已经成熟到能帮用户少踩很多坑,让AI集群运维从“人工巡检”变成了“智能自治”。



寒武纪搞了一套完整的运维工具,CntrainKit-Accu能在万卡分布式训练场景里定位精度问题,遇到NaN/Inf这种异常情况,能快速找到问题所在;CntrainKit-Monitor能实时监控集群的通信和算子性能,让管理员随时掌握集群状态。

CNCE集群监管平台更厉害,能监控十万卡级的算力集群,秒级采集状态信息,还能自动发现故障、智能诊断、自动处理,形成闭环管理。

CNAnalyzeInsight故障分析工具能快速处理GB级的日志,秒级检索和多维分析,能实现“发现异常、定位问题、归纳原因、给出修复建议”的完整流程。



这些工具的成熟,让大规模AI训练的可用性和稳定性提升了不少,也降低了运维人员的工作强度。

在开源生态适配方面,寒武纪也做得很到位,PyTorch从2.1到2.8的所有版本都能支持,DDP、FSDP、TensorParallelism这些关键功能也都适配好了。

他们还推出了GPU一键迁移工具,能帮用户近乎零成本把模型从GPU转到MLU,再配上精度和性能调试工具,开发者用起来也顺手。



寒武纪这近十年的坚持挺不容易的,从芯片架构到软件平台,再到生态工具,一点点打磨出了一套完整的软硬一体化体系。

现在他们的产品已经在大模型、搜广推、图片生成等多个场景完成验证并获得认可,在这个过程中,产品不断接受大规模场景的高强度检验,反过来又推动软件平台和芯片体系持续优化,形成了良性循环。

这波转型对寒武纪来说,不仅是业务范围的扩展,更是核心竞争力的提升。



从只卖芯片到提供完整解决方案,等于把产业链的话语权抓在了自己手里。

而对于整个行业来说,寒武纪的突破不仅打破了国际巨头在AI基础设施领域的垄断,也给国内企业提供了自主可控的算力选择,降低了产业对国外芯片的依赖。

随着AI技术向多模态、大参数、大规模部署的方向发展,寒武纪的这套体系还有很大的发挥空间。

只要继续保持技术迭代的速度,扩大生态合作的范围,相信国产AI算力会在全球市场占据更重要的位置,为智能经济的发展提供更坚实的支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
著名考古学家、原山西省考古研究所所长王克林逝世

著名考古学家、原山西省考古研究所所长王克林逝世

澎湃新闻
2026-04-07 17:00:26
英媒:图赫尔现场观战皇马vs拜仁,考察阿诺德的表现

英媒:图赫尔现场观战皇马vs拜仁,考察阿诺德的表现

懂球帝
2026-04-08 10:43:19
特朗普把传播玩明白了

特朗普把传播玩明白了

智远同学
2026-04-08 08:35:25
基辛格论断发人深省,中国可再出毛泽东?答案唯二字!

基辛格论断发人深省,中国可再出毛泽东?答案唯二字!

疯狂的小历史
2026-03-31 11:28:01
中国工程院院士廉玉波:全固态电池产业化已进入“攻坚阶段”

中国工程院院士廉玉波:全固态电池产业化已进入“攻坚阶段”

新京报
2026-04-07 13:33:05
破案了!王楚钦4-3逆转夺冠原因揭晓!幕后功臣现身,难怪成功

破案了!王楚钦4-3逆转夺冠原因揭晓!幕后功臣现身,难怪成功

不似少年游
2026-04-07 11:42:09
美军向中东增派A-10,被嫌弃了半辈子的“疣猪”如今却成战场主角

美军向中东增派A-10,被嫌弃了半辈子的“疣猪”如今却成战场主角

战刃
2026-03-31 21:01:32
又一城梦碎!地铁降温,没有悬念了

又一城梦碎!地铁降温,没有悬念了

西部城市
2026-04-07 20:32:36
官宣!全国超50城长期取消停车费:路边+机关车位全免费 民之所向

官宣!全国超50城长期取消停车费:路边+机关车位全免费 民之所向

好笑娱乐君每一天
2026-04-08 02:17:58
73岁李立群再为全红婵发声:不指望她再为国夺金 她背后有高人指点

73岁李立群再为全红婵发声:不指望她再为国夺金 她背后有高人指点

风过乡
2026-04-07 21:56:53
阿隆索遭弃!利物浦换帅反转,英超冠军名帅或重返安菲尔德

阿隆索遭弃!利物浦换帅反转,英超冠军名帅或重返安菲尔德

澜归序
2026-04-08 04:28:01
美军营救飞行员一定会被拍成电影,加个女主角不就是《黄河绝恋》吗?

美军营救飞行员一定会被拍成电影,加个女主角不就是《黄河绝恋》吗?

蓬辉堂
2026-04-06 20:09:28
数学的本质到底是什么?看完这篇文章你会爱上数学

数学的本质到底是什么?看完这篇文章你会爱上数学

真相Truth
2026-04-06 06:30:12
定了!天津一知名医院将搬迁!

定了!天津一知名医院将搬迁!

天津人
2026-04-08 06:35:31
张本智和观战决赛面露恐惧!日本球迷盼他退位:松岛已成日乒最强

张本智和观战决赛面露恐惧!日本球迷盼他退位:松岛已成日乒最强

颜小白的篮球梦
2026-04-07 08:22:42
校门口泛滥!深圳一小学生误喝,紧急送医!暗访多店大量发现!教育局曾发警示

校门口泛滥!深圳一小学生误喝,紧急送医!暗访多店大量发现!教育局曾发警示

南方都市报
2026-04-07 14:51:31
四小时摧毁伊朗,法国提前动手,中方罕见表态,伊朗:美国中计了

四小时摧毁伊朗,法国提前动手,中方罕见表态,伊朗:美国中计了

嫹笔牂牂
2026-04-08 10:20:33
郑丽文已到达南京,国民党一人口出狂言,不装了,赖清德正式发声

郑丽文已到达南京,国民党一人口出狂言,不装了,赖清德正式发声

DS北风
2026-04-07 18:38:24
美军上校说了大实话,派B2深入中国核心区,就像派出老头乐

美军上校说了大实话,派B2深入中国核心区,就像派出老头乐

安珈使者啊
2026-04-07 14:59:32
伊朗开出十点条件、巴基斯坦斡旋成功,中东大反转?

伊朗开出十点条件、巴基斯坦斡旋成功,中东大反转?

菁菁子衿
2026-04-08 10:48:45
2026-04-08 11:40:49
蔡蔡说史
蔡蔡说史
多看点儿历史知识其实挺好的
3549文章数 80关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

午评:创业板指半日涨4.81% 全市场超5000只个股上涨

头条要闻

午评:创业板指半日涨4.81% 全市场超5000只个股上涨

体育要闻

皇马1.5亿巨星浪费超级单刀 丢球摊手抱怨

娱乐要闻

杨颖邓超低调现身观众席 支持陈赫话剧

财经要闻

特朗普同意停火两周 伊朗:接受停火提议

汽车要闻

5门5座/新复古造型 缤果Pro将于4月14日开启预售

态度原创

艺术
本地
数码
手机
公开课

艺术要闻

齐白石『凌波仙子』

本地新闻

跟着歌声游安徽,听古村回响

数码要闻

闪迪推出2TB Extreme Pro UHS-II SD存储卡

手机要闻

看片不再被吓一跳!Binge恐怖片预警神器上线:支持灵动岛提醒

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版