高通公司(Qualcomm)正在通过一系列专为人工智能推理设计的新数据中心硬件进行扩张。这家总部位于圣地亚哥的公司周一推出了新的AI200和AI250加速器芯片,将自己定位为与Nvidia和AMD在人工智能硬件市场竞争者。据高通公司称,这些新芯片将提供增强的内存容量、机架级配置以及与主要人工智能框架的兼容性。
![]()
高通公司表示,其AI200加速器支持每张卡768 GB的LPDDR内存,并针对大型语言模型、多模式系统和相关工作负载的AI推理进行了优化。尽管AI200被设计为加速器卡,但高通公司将其描述为运行生成式人工智能应用程序的机架级系统。AI250具有近内存计算设计,可减少数据移动和功耗,同时支持分类AI推理。这两种机架系统都使用直接液体冷却,额定功耗为160千瓦。它们还支持PCIe和以太网,并包括机密计算功能,以保护敏感的工作负载。
该公告是高通公司进入数据中心加速器市场的重要举措,目前该市场由Nvidia的GPU主导,最近AMD的MI300系列也强势推出。高通公司的核心业务历来集中在无线和移动处理器上,包括其用于智能手机的Snapdragon系统芯片。但随着该公司面临手机需求放缓,开始进军汽车、个人计算等其他领域,现在还进军大规模人工智能基础设施。到目前为止,其数据中心战略似乎更侧重于能源效率,而不仅仅是原始吞吐量。
![]()
这对高通公司来说可能是一个明智的策略,因为推理工作负载正在围绕功率和内存限制重塑数据中心设计。随着大型模型要求更高的吞吐量和效率,供应商越来越多地开发用于生产规模人工智能的推理优化系统。高通公司的近内存和液冷设计解决了性能和能源使用方面的同样压力。
今年5月,高通公司宣布与国家支持的沙特人工智能公司Humain建立合作关系,为其在该地区的数据中心提供人工智能芯片。Humain承诺从2026年开始部署高达200兆瓦的高通人工智能系统,增加Nvidia向Humain承诺的18000个Blackwell GPU和AMD 100亿美元的投资。该协议可能会让高通及其竞争对手在一个大力投资主权人工智能基础设施的地区站稳脚跟。它还将提供大规模部署,以展示高通公司的新硬件。
AI200和AI250将在交错的时间线上推出,AI200预计将于2026年上市,AI250将于2027年上市。高通公司没有透露吞吐量或过程节点等详细的性能规格,尽管该公司表示这些芯片将支持标准的人工智能框架和工具。作为一家无晶圆厂芯片设计公司,高通公司没有透露哪个(或哪些)代工厂将生产芯片,这给制造规模和交付周期留下了悬疑。
高通公司最近的收购也表明其对人工智能和数据中心技术的投资不断增长。今年,该公司收购了越南VinAI的生成式人工智能部门Movian AI、以色列汽车通信芯片制造商Autotalks、Alphawave IP Group(一家专注于数据中心连接的英国半导体公司)、以及意大利开源微控制器平台制造商Arduino。虽然高通公司没有将这些收购直接与AI200或AI250联系起来,但它们表明了该公司如何在人工智能和数据中心基础设施领域发挥更大的作用。
![]()
高通公司宣布这一消息之际,数据中心和高性能计算领域的人工智能工作负载竞争激烈,虽然英伟达占据了最大的市场份额(有些估计高达94%),但AMD、英特尔等公司以及NextSilicon等初创公司正在加紧提供替代品。高通公司现在加入了这一拥挤的供应商赛道,旨在随着人工智能工作负载的扩大提高能源效率。
高通公司将其低功耗专业知识扩展到数据中心的能力将决定其进入人工智能基础设施是利基实验还是市场上的持久存在。投资者似乎很有信心:该公司股价周一上涨超过11%,而当天早些时候曾上涨22%。该公司拥有竞争的技术背景和资本,但执行将取决于其硬件与其他人工智能平台的性能以及其扩展速度。未来几年将测试该公司以效率为导向的方法是否能够在由成熟芯片制造商控制的行业中竞争。
与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。欢迎扫码加入我们!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.