据THE ELEC 近日报道,随着AI重心向推理迁移,超大规模云厂商正通过自研芯片调整战略。谷歌云发布首款推理专用芯片TPU 8i,优化SRAM至384MB、通信链路减至7级、搭载CAE引擎,实现每美元性能提升80%、能效翻倍;其训练芯片TPU 8t训练速度较前代提升3倍,可支撑百万级芯片集群。
AWS则强化Trainium 3的推理能力,单芯片配备144GB高带宽内存,实现“训完即部署”,并宣称其为“全球最佳推理平台”,同时对Inferentia 3未作披露。Meta已与AWS达成数十亿美元长期协议,重点采购192核Graviton 5 CPU,成为其前五大客户,推动算力多元化以降低对英伟达依赖。
微软(MSFT.US)1月发布的Maia 200推理芯片FP4算力达Trainium 3的3倍,搭载216GB HBM3e。Anthropic成为唯一获AWS、微软、谷歌三大云厂商投资的AI企业:谷歌投资400亿美元(100亿即时,估值3500亿,提供5GW算力),亚马逊累计投资330亿美元(含250亿追加,提供3GW算力),微软联合英伟达投资150亿美元(出资50亿,提供约1–1.5GW算力),算力竞争格局全面升级。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.