网易首页 > 网易号 > 正文 申请入驻

微软推出Maia 200 提升 AI 推理门槛

0
分享至

微软(Microsoft) 推出了 Maia 200,这是其用于驱动 AI 工作负载的自研芯片的最新迭代版本。Maia 200 拥有一些令人印象深刻的数据,包括 10 petaflops 的 FP4 算力和 216GB 的HBM3,这让 Microsoft 及其 Azure 云在 AI Token 生成方面获得了立竿见影的提升。更重要的是,这给了 Microsoft在自研 AI 加速器方面超越 AWS 和 Google Cloud 的底气。


Microsoft 表示,Maia 200 是其首款专门解决 AI 性能挑战的芯片。除了原始的数字运算能力,AI 推理还需要大量高速内存,以及内存和处理器之间的高速链接。Maia 200 似乎在这两个方面都有所斩获。

Maia 200 采用台积电 3nm (纳米)工艺开发,功耗设计(TDP)为 750 瓦。Maia 200 的核心包含两个执行引擎:一个是用于高吞吐量矩阵乘法和卷积的 Tile Tensor Unit(TTU:Tile 张量处理单元),支持 FP8、FP6和 FP4 精度;另一个是用于 SIMD(单指令多数据)指令的 Tile Vector Processor(TVP:Tile 向量处理器),提供 FP8、BF16和 FP32 处理能力。TTU 和 TVP 执行引擎连接到 216GB 的高带宽内存(HBM3)以及 272MB 的片上TSRAM(Tile 静态随机存取存储器)。

Maia 200 配备了一个直接内存访问(DMA)子系统,用于在 TSRAM 和TTU 之间保持数据流动,以及一个小的 Tile Control Processor(TCP:Tile 控制处理器)来协调TTU 和 DMA 之间的工作。

根据 Azure 工程博客中 Saurabh Dighe(系统与架构副总裁)和 Artour Levin(AI 硅工程副总裁)撰写的 Maia 200 深度解析,Maia 200 架构的一个决定性特征是其丰富的内存和内存层次结构。“这种巨大的片上内存资源支持广泛的各种低延迟、高带宽的数据管理策略。”他们写道。“CSRAM 和 TSRAM都是完全软件管理的,允许开发者——或编译器/运行时——确定性地放置和固定数据,以精确控制数据的局部性和移动。”


Maia 200 芯片配备了片上以太网网络接口卡(NIC),与相邻芯片之间提供每秒 2.8 TB 的双向带宽。据 Dighe 和 Levin 介绍,Maia 200 采用了“两层、纵向扩展”拓扑结构,结合了基于以太网的纵向扩展互连,可在包含多达 6,144 个加速器的集群中提供高带宽、低延迟通信。

Microsoft 表示,它可以在一个“两层、纵向扩展”集群拓扑中连接多达6,144 个 Maia 200 加速器。

据 Dighe 和Levin 称,Maia 200 的 Tile 级处理能力,结合 DMA 和片上网络能力,使芯片能够达到当今大规模 AI 工作负载所需的广泛规模。“DMA 引擎专为多通道、高带宽传输而设计,支持 1D/2D/3D 步进移动,使常见的 ML 张量布局能够在片上 SRAM、HBM和外部接口之间高效移动,同时实现数据移动与计算的重叠,”他们写道。“同时,NoC 在集群和内存子系统之间提供可扩展、低延迟的通信,并支持单播和多播传输——这是分发张量块和协调并行执行的重要能力。”

距离 Microsoft 推出 Maia 100——其首款专门用于 AI 推理的第一代 AI 加速器——刚刚过去两年多。Maia 100 采用台积电 5 纳米工艺开发,提供每秒 1.8 TB 的双向内存带宽和 64GB SRAM。它提供 3.2 petaflops 的 MXFP4 性能和 1.6 petaflops 的 FP8 或 MXInt8 性能,大约是Maia 200 的三分之一。

Maia 200 的能力与其他顶级 AI 加速器相当,使其成为“AI 推理动力源”,Microsoft 云和 AI 执行副总裁 Scott Guthrie 表示:“实际上,Maia 200 可以轻松运行当今最大的模型,并为未来更大的模型留出充足的空间。”“Maia 200 是来自任何超大规模云服务商的最强大的第一方硅芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能高于 Google 第七代 TPU。”他还补充说:“Maia 200 也是 Microsoft 部署过的最高效的推理系统,与目前我们机群中的最新代硬件相比,性能提升了 30%。”


Maia 200 可在风冷和水冷环境中运行。它的设计旨在与 Azure 的第三方 GPU 机群协同工作,并遵守机架、电源和机械架构的标准。它集成到 Azure 的原生控制平面中,Microsoft 这使得部署和服务变得轻而易举,同时与同一数据中心空间内的其他 AI 加速器和谐共存。

Microsoft 计划使用其 Maia 200 芯片运行各种模型,包括最新的 OpenAI GPT-5.2 模型。它还将用于生成合成数据,供 AI 模型用于训练目的。新芯片目前部署在 Microsoft 位于爱荷华州得梅因附近的 Central 数据中心区域。它接下来将部署在亚利桑那州凤凰城附近的 US West 3 数据中心区域,未来还会有更多区域跟进。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
散尽百万家产也付不起抗癌账单,美国天价医疗疮疤再度被揭开

散尽百万家产也付不起抗癌账单,美国天价医疗疮疤再度被揭开

新民周刊
2026-02-15 14:06:28
你敢信?一群刚从中国回去的老外,对着自家的西餐,愣是吃不了了

你敢信?一群刚从中国回去的老外,对着自家的西餐,愣是吃不了了

老谢谈史
2026-02-06 12:36:54
河南春晚被骂上热搜!大量广告穿插少量节目,满屏AI没什么活人感

河南春晚被骂上热搜!大量广告穿插少量节目,满屏AI没什么活人感

东方不败然多多
2026-02-15 09:58:11
报复一个人最狠的方法,不是翻脸,不是打压,而是佛家三句话

报复一个人最狠的方法,不是翻脸,不是打压,而是佛家三句话

瓜哥的动物日记
2026-02-14 00:59:40
男人耗阳的10大行为

男人耗阳的10大行为

健身迷
2026-02-15 09:46:17
王毅:支持通过对话政治解决一切地区热点

王毅:支持通过对话政治解决一切地区热点

界面新闻
2026-02-14 21:44:47
高市没想到,日本刚扣押中国渔船,抓走船长,中方就迅速出手了

高市没想到,日本刚扣押中国渔船,抓走船长,中方就迅速出手了

丁铗惊悚影视解说
2026-02-14 11:50:39
俄媒:一旦开战,中方只靠解放军难以取胜,必须调动另一股力量!

俄媒:一旦开战,中方只靠解放军难以取胜,必须调动另一股力量!

勇士军武闲谈
2026-02-13 11:54:35
日媒踢爆:石原里美老公露脸,年收高达1亿,繁忙工作之余还做家务带孩子,这世界上还有这样的男人吗?

日媒踢爆:石原里美老公露脸,年收高达1亿,繁忙工作之余还做家务带孩子,这世界上还有这样的男人吗?

日本物语
2026-02-14 20:44:32
过年买菜,建议大家:少买芹菜和萝卜,多买3样,应季鲜美寓意好

过年买菜,建议大家:少买芹菜和萝卜,多买3样,应季鲜美寓意好

江江食研社
2026-02-14 20:30:03
中国女性出轨率高达七成,不是寂寞,而是背后藏着不为人知的隐痛

中国女性出轨率高达七成,不是寂寞,而是背后藏着不为人知的隐痛

易玄
2026-02-14 12:09:25
河南小伙在非洲16年,当地一夫多妻制,男人只用玩,女人挣钱养家

河南小伙在非洲16年,当地一夫多妻制,男人只用玩,女人挣钱养家

大鱼简科
2026-02-07 16:50:52
全民开赌!

全民开赌!

求实处
2026-02-15 01:00:57
全线反弹!加密货币大涨,超9万人爆仓

全线反弹!加密货币大涨,超9万人爆仓

证券时报e公司
2026-02-15 08:20:57
特斯拉新春福利翻车!网友集体喊话陶琳:别送周边,我要EAP/FSD

特斯拉新春福利翻车!网友集体喊话陶琳:别送周边,我要EAP/FSD

雷科技
2026-02-15 13:50:13
自己摔倒!林孝埈连续两项小组垫底出局 坐在冰面上 眼神绝望无奈

自己摔倒!林孝埈连续两项小组垫底出局 坐在冰面上 眼神绝望无奈

念洲
2026-02-15 06:50:57
中美博弈本质?英专家:中国触碰了西方300年来最大的“禁忌”

中美博弈本质?英专家:中国触碰了西方300年来最大的“禁忌”

琴音缭绕回
2026-02-14 12:07:27
刘虎回家过年,这个春节最快乐的事

刘虎回家过年,这个春节最快乐的事

涛哥锐评
2026-02-14 23:16:16
高龄补贴涨钱了,满70岁的退休人员符合要求吗?每月都可领钱?

高龄补贴涨钱了,满70岁的退休人员符合要求吗?每月都可领钱?

猫叔东山再起
2026-02-15 08:30:07
身家过亿的财经女侠叶檀,抗癌3年悔悟:丁克是这辈子最错的决定

身家过亿的财经女侠叶檀,抗癌3年悔悟:丁克是这辈子最错的决定

青眼财经
2026-02-11 19:36:31
2026-02-15 15:47:00
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1651文章数 511关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

本地
教育
游戏
健康
公开课

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

教育要闻

不得不说,近年来教育中的各种乱象,促进了教育巨大进步

《零 ~红蝶~ REMAKE》试玩报告:和无名野鬼大战二十回合

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版