网易首页 > 网易号 > 正文 申请入驻

技术验证收官!寒武纪软件平台发力,国产AI算力打破垄断

0
分享至

中国AI芯片公司寒武纪的CambriconNeuWare基础软件平台,已经在大模型训练推理、搜广推这些核心场景完成了大规模技术验证。

这事儿可不是小打小闹,标志着这家公司从单纯卖芯片的硬件供应商,正式转向能提供完整AI解决方案的平台企业,转型之路迈出了关键一步。

现在AI圈的算力竞争早就变味儿了。



不再是比谁的芯片性能参数更亮眼,而是要看软硬件能不能协同发力,生态体系完不完善,大规模部署的时候稳不稳定。

寒武纪能走到这一步,靠的就是这些年一直坚持的训练推理融合和统一软件平台战略,显然是摸准了行业发展的脉搏。

底层技术打底,国产算力有了核心底气

寒武纪的软件平台能站稳脚跟,底层技术创新是绝对的核心支撑。



驱动和运行时库这块,业务能连续运行好几个月不关机,这种高稳定性在大规模商业部署里太重要了。

毕竟谁也不想训练一个大模型到关键时刻,突然因为系统崩溃前功尽弃。

本来以为调度吞吐率这种技术指标离实际应用很远,后来发现它直接影响处理速度。

寒武纪用细粒度并行技术,把内核函数调度吞吐提得很高,面对海量用户请求的高并发场景,也能稳稳扛住压力。



通信技术上的优化也很有针对性,针对DeepSeekV3这类混合专家模型,他们搞了类IBGDA接口,专门解决推理阶段的性能瓶颈。

资源管理还分了三种模式,visiblecluster能弹性拆分方便快速部署,sMLU支持容器化部署,MIM技术对标国际主流的MIG功能,不管是中小企业小范围试用,还是大型企业大规模集群部署,都能找到合适的方式。

编译器是AI软件的核心竞争力,寒武纪的BANGC语言专门针对自己的MLU芯片做了优化,支持多种高级编译技术,核心算子的效率已经达到业界领先水平。



而且他们还快速跟进开源社区的Triton标准,3.4版本的所有特性都能支持,部分热点算子的性能甚至能和手写算子相当,这就让开发者不用重新学习新的工具,模型迁移起来也顺畅多了。

技术再好,也得经过实际场景的检验。

寒武纪的软件平台到底好不好用,大模型训练和搜广推这些核心场景最有发言权,毕竟这些场景是AI技术商业化最关键的阵地。



场景验证通关,技术落地走出关键一步

搜广推场景每天要处理海量用户请求,还得在极短时间内给出精准结果,对算力平台的吞吐量、延迟和稳定性要求都特别高。

寒武纪的解决方案在这儿已经稳定运行好几个月,精度和稳定性都达到了商业要求,这就说明技术已经成熟到能落地赚钱了。

他们还针对Layernorm、RMSNorm这些常用算子做了优化,进一步提升了运行速度。



大模型训练方面,不管是DeepSeekV3/V3.1、Qwen2.5/Qwen3这些热门的混合专家模型,还是GLM4.5、Flux、Hunyuan-Video这类多模态模型,寒武纪的平台都能支持。

而且还搞了FP8低精度训练,在保证精度的前提下,能帮企业省下不少算力成本,这在现在AI训练成本居高不下的情况下,吸引力确实不小。

推理场景的技术探索也没落下,新的W4A4、MX-FP8这些低比特数据类型,还有稀疏注意力、线性注意力这些高效机制都有适配。



连Qwen-Omni多模态融合模型、Hunyuan3D3D生成模型、CosyVoice语音生成模型这些新兴领域,平台也能支持。

特别是DeepSeekV3.2-Exp模型一发布,寒武纪马上就完成适配还开源了代码,这种快速响应能力,在竞争激烈的AI行业里很加分。

分布式通信是大规模训练的关键,寒武纪针对这个场景新增了HDR/DBT等Allreduce通信算法,提升了大规模部署时的通信带宽,Alltoall操作的扩展性也跟上了国际主流水平。



还加了在线打点、模块化日志这些可维可测功能,遇到通信错误或者异常卡死的问题,能快速找到原因,不用再靠人工一点点排查。

大规模部署不仅考验技术,还考验运维能力。

寒武纪显然想到了这一点,配套的生态工具已经成熟到能帮用户少踩很多坑,让AI集群运维从“人工巡检”变成了“智能自治”。



寒武纪搞了一套完整的运维工具,CntrainKit-Accu能在万卡分布式训练场景里定位精度问题,遇到NaN/Inf这种异常情况,能快速找到问题所在;CntrainKit-Monitor能实时监控集群的通信和算子性能,让管理员随时掌握集群状态。

CNCE集群监管平台更厉害,能监控十万卡级的算力集群,秒级采集状态信息,还能自动发现故障、智能诊断、自动处理,形成闭环管理。

CNAnalyzeInsight故障分析工具能快速处理GB级的日志,秒级检索和多维分析,能实现“发现异常、定位问题、归纳原因、给出修复建议”的完整流程。



这些工具的成熟,让大规模AI训练的可用性和稳定性提升了不少,也降低了运维人员的工作强度。

在开源生态适配方面,寒武纪也做得很到位,PyTorch从2.1到2.8的所有版本都能支持,DDP、FSDP、TensorParallelism这些关键功能也都适配好了。

他们还推出了GPU一键迁移工具,能帮用户近乎零成本把模型从GPU转到MLU,再配上精度和性能调试工具,开发者用起来也顺手。



寒武纪这近十年的坚持挺不容易的,从芯片架构到软件平台,再到生态工具,一点点打磨出了一套完整的软硬一体化体系。

现在他们的产品已经在大模型、搜广推、图片生成等多个场景完成验证并获得认可,在这个过程中,产品不断接受大规模场景的高强度检验,反过来又推动软件平台和芯片体系持续优化,形成了良性循环。

这波转型对寒武纪来说,不仅是业务范围的扩展,更是核心竞争力的提升。



从只卖芯片到提供完整解决方案,等于把产业链的话语权抓在了自己手里。

而对于整个行业来说,寒武纪的突破不仅打破了国际巨头在AI基础设施领域的垄断,也给国内企业提供了自主可控的算力选择,降低了产业对国外芯片的依赖。

随着AI技术向多模态、大参数、大规模部署的方向发展,寒武纪的这套体系还有很大的发挥空间。

只要继续保持技术迭代的速度,扩大生态合作的范围,相信国产AI算力会在全球市场占据更重要的位置,为智能经济的发展提供更坚实的支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一夜清零!北京知名相声社人去楼空,演员靠直播赚生活费,

一夜清零!北京知名相声社人去楼空,演员靠直播赚生活费,

可乐谈情感
2025-11-08 15:15:24
赵鸿刚被禁赛半年,剩余5场比赛全部取消,伤势比想象的严重很多

赵鸿刚被禁赛半年,剩余5场比赛全部取消,伤势比想象的严重很多

新游戏大妹子
2025-11-08 13:08:22
评分最高的10部犯罪悬疑剧:《沉默的真相》第3,第1名霸榜10年

评分最高的10部犯罪悬疑剧:《沉默的真相》第3,第1名霸榜10年

电影聚焦
2025-11-07 09:56:59
马刺绞赢火箭:泥淖战;约基奇的三双?不要了

马刺绞赢火箭:泥淖战;约基奇的三双?不要了

张佳玮写字的地方
2025-11-08 14:11:14
167票当选!联合国变天,新主席对华态度不一般?中方提出4个要求

167票当选!联合国变天,新主席对华态度不一般?中方提出4个要求

爱吃醋的猫咪
2025-11-07 21:01:04
崩了,全部暴跌

崩了,全部暴跌

淮安网
2025-11-08 08:58:22
爆冷门!朱婷赛后拒绝采访含泪离场,教练回应引全网热议

爆冷门!朱婷赛后拒绝采访含泪离场,教练回应引全网热议

去山野间追风
2025-11-08 12:51:22
当今社会,为什么很多人看不惯拿高额退休金的老人?

当今社会,为什么很多人看不惯拿高额退休金的老人?

诗词中国
2025-11-07 19:45:21
最强17级以上!台风“凤凰”路径大拐弯!福建将迎大雨暴雨

最强17级以上!台风“凤凰”路径大拐弯!福建将迎大雨暴雨

环球网资讯
2025-11-08 13:41:04
巴总统:已正式通知中国,退出一带一路计划,我方回应4个字

巴总统:已正式通知中国,退出一带一路计划,我方回应4个字

花花娱界
2025-11-07 20:53:23
澳洲地产大亨之子重病赴华求治,老中医开口一句令男子彻底傻眼

澳洲地产大亨之子重病赴华求治,老中医开口一句令男子彻底傻眼

红豆讲堂
2025-10-14 09:30:03
太牛了!把90%白鹅绒充进T恤,拒水又耐脏,薄薄一件比羊毛衫还暖!

太牛了!把90%白鹅绒充进T恤,拒水又耐脏,薄薄一件比羊毛衫还暖!

英国报姐
2025-11-07 22:04:06
一高三学生在租住房自杀身亡,房主以房屋贬值为由向家长索赔12万 法院驳回诉讼请求

一高三学生在租住房自杀身亡,房主以房屋贬值为由向家长索赔12万 法院驳回诉讼请求

红星新闻
2025-11-08 10:59:14
长沙医生不雅视频事件发酵!涉事两人家庭情况清晰了,女主是单身

长沙医生不雅视频事件发酵!涉事两人家庭情况清晰了,女主是单身

火山诗话
2025-11-08 06:01:59
超级工程开工!省委书记、省长赴现场

超级工程开工!省委书记、省长赴现场

上观新闻
2025-11-08 16:29:07
英超重磅对决!曼城复仇战:瓜帅1000场 魔人冲百球破纪录

英超重磅对决!曼城复仇战:瓜帅1000场 魔人冲百球破纪录

叶青足球世界
2025-11-08 22:55:41
空乘穿毛衣上班被吐槽“很土”,山东航空回应

空乘穿毛衣上班被吐槽“很土”,山东航空回应

大风新闻
2025-11-08 14:47:09
《四喜》开播遭群嘲!表情狰狞、怒吼,连蒋欣都带不动这个拖油瓶

《四喜》开播遭群嘲!表情狰狞、怒吼,连蒋欣都带不动这个拖油瓶

胡一舸南游y
2025-11-08 13:00:07
全球军队研究印巴57空战,发现最震撼细节,难怪印度4天就认怂

全球军队研究印巴57空战,发现最震撼细节,难怪印度4天就认怂

百科密码
2025-11-07 16:50:53
首映轰下1300万,《杀戮之地》夺冠,铁血战士把影后辛芷蕾打懵了

首映轰下1300万,《杀戮之地》夺冠,铁血战士把影后辛芷蕾打懵了

电影票房预告片
2025-11-07 22:42:35
2025-11-08 23:04:49
蔡蔡说史
蔡蔡说史
多看点儿历史知识其实挺好的
1431文章数 43关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

美财长:美25年来制造首块稀土磁铁 结束中国"卡脖子"

头条要闻

美财长:美25年来制造首块稀土磁铁 结束中国"卡脖子"

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

游戏
教育
房产
艺术
军事航空

秋促给他腾时间?《半条命3》11月18日会公布吗

教育要闻

江西师范大学2026届保研539人,汉语言文学29人

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

艺术要闻

1008米!世界新第一高楼项目,迎来第三家中国公司加入

军事要闻

福建舰常驻地为三亚军港

无障碍浏览 进入关怀版