![]()
全球的数据中心正在变成一个电力黑洞。训练和运行大型语言模型所需的计算量每隔几个月就翻一番,而支撑这些计算的GPU芯片,功耗也在同步飙升。
有研究机构估计,到本十年末,全球数据中心的电力消耗将比现在翻一番,这还只是保守估计。现在,一家从牛津大学孵化出来的初创公司,正在用一个根本性的技术转向挑战这个困局:用光来替代电子做计算。
光子取代电子,算力提升五十倍
Lumai公司的核心产品叫做Iris Nova,是一台推理服务器,但它内部运行计算的方式与所有现有服务器都截然不同。
传统服务器依赖硅芯片,用电子流动来执行计算。这条路已经走了半个多世纪,但如今摩尔定律的红利正在消退,每一代新芯片带来的性能提升越来越小,而功耗却在持续攀升。英伟达的H100 GPU单卡热设计功耗高达700瓦,新一代产品更是进一步突破这个数字,整个机架的散热和供电成本正在成为数据中心运营的主要瓶颈。
Lumai选择了一条完全不同的路径。Iris Nova使用光而非电子来执行矩阵乘法等核心数学运算,这类运算恰恰占据了大型语言模型推理计算量的绝大部分。
具体而言,服务器内部采用了混合架构,光学张量引擎承担数学计算,数字处理器负责系统控制和调度。光在三维空间中传播,可以同时执行数百万次并行运算,这是二维硅芯片在物理结构上难以企及的优势。
EE Times的技术分析报告指出,Lumai声称其光学计算性能是同等GPU的约50倍,同时功耗降低高达90%。该公司已使用Iris Nova服务器对Meta开源的Llama 8B和70B两个版本的大型语言模型进行了实时推理演示,验证了系统在十亿参数量级模型上的实际可用性,而非仅停留在实验室条件下的理论测试。
这个数字如果经得起独立验证,其意义将相当深远。一台功耗降低九成的AI推理服务器,意味着同样的电力预算可以支撑十倍规模的计算能力,或者同样规模的数据中心可以将电费和碳排放压缩到原来的十分之一。
英国政府支持的高级研究与发明机构ARIA的项目总监苏拉杰·布拉姆哈瓦尔对此给出了相当直接的评价:"现有AI处理器面临的巨大需求迫切需要寻找其他扩展途径,Lumai公司正引领潮流,证明光处理器可以提供这样一条途径。"
当然,对于一项如此早期的商业化技术,保持审慎同样必要。光学计算并非新概念,过去数十年间已有多家公司尝试将光子器件引入通用计算,但大多数折戟于精度控制、可编程性和规模化制造三道关卡。Lumai的技术路线采用基于透镜的三维光学系统,与此前多数方案有所不同,但其在真实数据中心环境中长期稳定运行的表现,以及与现有工作流的实际兼容程度,仍有待更大规模的部署检验。
目前,Lumai已向超大规模数据中心、云平台、企业和研究机构开放Iris Nova服务器的评估申请,其产品线还包括容量更大的Aura和Tetra两款服务器,面向更高强度的推理负载。
Lumai首席执行官郭先新将这一时刻定义为一个分水岭:"随着行业向推理时代过渡,我们也同时跨越了后硅时代的门槛。"
这句话说得有些宏大,但它所描述的方向,正是整个半导体和AI基础设施行业都在焦虑地寻找的出口。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.