![]()
![]()
微软Maia 200 AI芯片核心发布
微软提前发布自研新一代AI推理加速器Maia 200,基于台积电3纳米工艺打造,旨在优化AI token生成经济性,重新定义AI算力性价比。
该芯片配备原生FP8/FP4张量核心及全新内存系统,拥有216GB HBM3e内存、7TB/s带宽,FP4性能达第三代Amazon Trainium的三倍,超越谷歌第七代TPU的FP8性能。
![]()
Maia 200能效表现优异,每美元性能较微软当前最新硬件提升30%,750W功耗内可提供超10 PetaFLOPS的FP4性能与超5 PetaFLOPS的FP8性能。
其独特内存子系统搭配DMA引擎、片上SRAM及专用NoC总线,破解数据传输瓶颈,大幅提升Token吞吐量。
这款芯片将为OpenAI GPT-5.2等大模型提供支持,赋能Microsoft Foundry及Microsoft 365 Copilot,助力合成数据生成与强化学习。
Maia 200已部署于美国中部数据中心,后续将扩展至西部区域,未来还会覆盖更多地区。
它与Azure无缝集成,微软正开放Maia SDK预览,提供PyTorch集成、Triton编译器等工具,兼顾精细化控制与跨硬件迁移灵活性。
系统层面采用以太网两层Scale-up网络设计,单个加速器双向带宽达2.8 TB/s,支持6144个加速器集群的高效集合通信。
微软通过预芯片模拟环境及端到端协同优化,实现芯片快速部署,从首颗芯片到机架部署时间较同类项目缩短一半以上。
微软已启动Maia系列后续产品设计,持续以跨代升级树立标杆,为大规模AI工作负载提供更卓越的性能与效率支撑。
![]()
—— 芯榜 ——
芯榜成立于 2015 年,是半导体垂直领域的产业媒体与数字化服务平台。全网覆盖超 100 万垂直行业用户,核心提供专业榜单发布、原创访谈、产业报告、峰会活动及研究咨询等服务。已合作近千家半导体生态企业,联动多家基金公司与产业媒体,助力硬科技产业发展。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.