硅光子技术正成为HPC(高性能计算)系统中在GPU和CPU之间传输海量数据的新路径,但如果能纯粹用光和光子来计算呢?这正是Lumai开发的光计算技术的目标——该公司发布了首款服务器,名为Iris。
![]()
Lumai公司从牛津大学孵化而来,牛津在光域处理数据方面开创了全新方法。该公司的三维光技术利用激光和薄膜的组合,将数据编码为光,然后对其执行一系列计算。
"AI的核心是向量-矩阵或矩阵-矩阵乘法。"Lumai产品负责人Phil Burr说。"我们的做法是将输入向量编码为光。通过透镜传入向量,我们实际上可以零成本地复制它。然后将该向量与矩阵相乘——矩阵值编码在薄膜的透射率中。"
他说,这项光技术可以完成与TPU和GPU相同类型的计算。Lumai技术的一大优势(除了节能之外)是能够计算非常大的矩阵,最高可达2048×2048。
"这意味着非常高效、非常快,"Burr说。"如果用硬件做,你没法处理这么大的矩阵。你必须细分成小得多的矩阵,然后来回搬运数据来重组矩阵,非常浪费。这正是Lumai方法真正高效的原因。"
![]()
Lumai推出三款Iris系列服务器:Nova、Aura和Tetra。Nova即日起供超大规模云厂商、新兴云服务商、企业和研究机构评估,能使用混合处理器运行Llama 8B和70B大模型。量产品Aura计划2028年推出,Tetra 则计划到2029年。
Lumai称其技术执行同样的矩阵乘法用于AI推理工作负载时,耗电量比基于GPU的系统减少90%。这得益于三维光计算独特的扩展特性。
"数光转换是有成本的,"Burr说。"功耗与向量宽度成正比,而性能是平方关系。所以随着矩阵尺寸增大,效率不断提升。"
Lumai的光计算机使用了数据中心已有的许多商用现成技术,包括激光器。Burr说,用于硅光子的同类型激光器也能驱动Lumai技术的计算。
![]()
"所以本质上已经有规模化制造了,"他说。"我们不需要创造任何新材料。量产时成本实际上会低于Nvidia GPU。"
同样,Lumai服务器编程和运行的软件栈也不像光计算本身那么异类。Lumai接入现有数据流,应用可以用PyTorch等框架开发。Burr说,Lumai开发硬件专用内核,让开发者能用PyTorch对Iris服务器编程。
AI的巨大能源需求正可能在AI完全起飞之前就使其脱轨。据彭博社报道,今年美国近半数数据中心项目将被延迟或取消,电力和电气组件(如变压器)的获取难度是首要原因。
"关注度这么高的部分原因是人们认识到硅扩展基本已经到头了,"Burr说。"是的,你可以缩小制程节点,但收益已大不如前,本质上要获得更高性能就得付出更多功耗、更多复杂性。封装更大、更热。所以人们看看传统数字系统的路线图,再看看自己的软件需求路线图,两者对不上。他们意识到必须寻找新技术。"
Lumai将其技术定位为在不突破能源预算的前提下驱动智能体AI新世界。具体来说,它瞄准的是AI推理的prefill阶段——该阶段通常是计算密集型的,受益于能快速处理大量数据的强力处理器,如GPU和TPU。相比之下,decode阶段通常是内存密集型的。
Lumai联合创始人兼CEO Xianxin Guo博士表示:"随着行业迈入推理时代,我们同时跨越了后硅时代的门槛。通过将计算范式从电子转向光子,Lumai能实现数量级的性能提升,同时大幅节能。"
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.