![]()
资料图。本文来源:北京商报、中国国创会
本账号接受投稿,投稿邮箱:jingjixuejiaquan@126.com
资料图。本文为新经济学家智库专稿,转载请注明来源。
本账号接受投稿,投稿邮箱:jingjixuejiaquan@126.com
在玻璃上雕刻闪电:一场静悄悄的算力革命
旻宏
新经济学家智库特约研究员
2025年12月18日,一枚面积仅136.5平方毫米的芯片在《科学》杂志上引发了物理学与计算机科学的双重震动。LightGen,这个由上海交通大学和清华大学联合研发的光学计算原型,以集成超过200万光子神经元的芯片,超越英伟达A100芯片百倍的速度和能效比,向世人展示了光子替代电子的惊人潜力。这不是第一次有研究者宣称在某项技术指标上超越行业标杆,当然也不会是最后一次。这次突破的意义远超单一技术指标的比较——它揭示了AI芯片竞争正在进入一个全新的阶段:传统电子芯片的物理弊端日益显现,而光学、神经形态、量子等多种技术路径正在同时发力,试图为人工智能的未来开辟新的可能性。
站在2025年末回望,现实世界中,巨头依然稳坐江山——英伟达仍掌控着全球AI算力的命脉,其2025年AI GPU市场份额高达92%——94%。然而就整体规模而言,这个已突破2032亿美元的庞大市场正以15.7%的年复合增长率狂奔向2032年的5648.7亿美元,这也就拥有了足够的空间容纳新技术的野蛮生长。
LightGen可能就是这样一道刺破旧秩序的光。
一、从电子到光子:计算范式的边界探索
光学计算并非新概念,它的历史几乎与数字计算机一样悠久,但始终未能实现大规模商业化。光子相比电子的本质优势在于更高的带宽、更低的能耗和天然的并行性——光子之间没有像电子那样的强库仑相互作用,这使得光学系统理论上可以同时处理大量信息流。然而,长期以来困扰光学计算的核心难题是缺乏可靠的光学存储器、模拟信号的噪声控制,以及与现有电子基础设施的集成困难。LightGen的关键进展在于同时解决了光计算做生成任务的两个老问题:一是通过提出“光学潜在空间”,在光学域内实现网络维度的变化与表征变换,从而减少传统方案中耗时的维度转换与频繁光电往返;二是提出基于贝叶斯思想的训练策略,使光学生成模型训练对“显式标签”的依赖显著降低,更贴近生成式任务的训练需求。
这项突破的技术意义需要放在当前AI发展的能源危机背景下理解。生成式AI模型对算力的需求呈指数级增长,而传统电子芯片的能耗问题已成为制约AI规模化应用的关键瓶颈。英伟达A100 GPU的热设计功耗为400瓦,当数以万计的这类芯片集中在数据中心时,能耗和散热成本变得极为可观。LightGen声称的6.64×10²TOPS/瓦的能效,如果能在实际生产环境中复现,将为AI应用的可持续发展开辟新路径。
但这并不是说LightGen对现有电子芯片可迅速达成全面颠覆。虽然LightGen在生成式AI任务如图像合成、去噪、风格迁移和3D场景操作中表现优异,但从实验室原型到可量产、可商业化部署的产品,中间还有巨大的鸿沟需要跨越:光学芯片的温度敏感性、制造一致性、成本控制和与现有系统的兼容性,都是必须解决的工程问题。如果真正形成对现有方案的实质性挑战,光学芯片可能还有数年甚至更长时间的路要走,而在此期间,电子芯片技术也不会停滞不前。
从历史经验也可以看出,新计算范式的成功往往不是完全替代旧范式,而是找到其最适合的应用领域,与现有技术形成互补而非对立关系。光学芯片很可能也会沿着这条路径发展:不是全面取代GPU,而是在生成式AI、高速推理或特定视觉任务中找到自己的位置,成为AI计算生态系统中的一个重要组成部分。这种技术多样性恰恰是健康竞争环境的标志,它为不同需求的用户提供更多选择,也为整个行业的持续创新提供动力。
二、英伟达的护城河与多方位的包围
英伟达在AI芯片领域的主导地位建立在硬件性能、软件生态相互强化的基础之上:
硬件性能方面,以H100为例,它面向大模型引入Transformer Engine并支持FP8精度加速,同时提供80GB等显存配置与高带宽显存方案,在训练与推理中树立了当代电子GPU的性能标杆。而在迭代后的新电子GPU基线上,H200进一步把“显存容量/带宽”推向更高水平——官方强调其为首款提供141GB HBM3e、4.8TB/s带宽的GPU,容量接近H100两倍、带宽约1.4倍,以缓解生成式AI与LLM的内存瓶颈。进入Blackwell阶段,英伟达把FP4/FP8低精度张量计算与“AI工厂”式系统化部署作为核心叙事,并给出整机1,440GB总显存与64TB/s HBM3e带宽、以及FP8训练/FP4推理吞吐等指标,显示电子路线仍在快速演进。
更关键的是CUDA平台和cuDNN、TensorRT等软件工具,它们经过多年发展,已形成对主流深度学习开发与部署的关键支撑。 再叠加头部云与超大规模客户的持续部署,英伟达在硬件迭代、软件栈优化与生态网络效应之间形成闭环,使其优势很难被“单一技术突破”在短期内复制或撼动,需要在硬件、软件和生态建设上的全方位长期投入。
然而,英伟达的主导地位也正面临来自多个方向的挑战,而且这些挑战的性质与烈度并不相同。
在传统“同类竞争”层面,AMD正在把竞争从“单点芯片性能”扩展到“软硬一体与机架级方案”:AMD公开称MI300X已在Azure上为专有与开源模型提供生产级支持,并在2025年持续推出MI350/MI355X等路线与开放机架基础设施。英特尔方面,虽然市场端对其Gaudi 3出货目标做出下修讨论,但英特尔坚持选择在生态与规模化方面承压下持续投入。
更具结构性的挑战来自云与模型巨头的“自研加速器”策略:它们未必追求在所有工作负载上击败英伟达的GPU,但会在自家平台的特定任务上追求更好的TCO与供应稳定性。以微软为例,外媒报道虽然其Azure Maia量产及部署节奏迟缓,但自研AI芯片的路线仍在推进。这些对英伟达意味着一个长期结构变化:最大客户同时也是潜在替代方案的提供者,市场的均衡会更依赖供给、成本、软件栈与平台锁定等综合因素。
中国市场的变量则更复杂:一方面,政策与供应链环境的变化会迫使本土方案加速成熟;另一方面,本土路线也在通过“系统化集群能力”弥补单卡差异。华为公开把Ascend作为其AI计算战略基础,并强调通过SuperPoD互联、UnifiedBus等体系化能力来支撑更大规模的算力集群扩展,这类“系统路线”本质上是在与英伟达的整套平台能力对标。
三、技术路径的分叉:从单一到多元的范式转移
AI芯片技术正在经历一场范式转移,其特征不再是单一依赖冯·诺依曼架构,而是朝着多种替代与互补架构的方向分化。除了持续演进的GPU和新兴光学芯片,神经形态计算正试图模仿大脑的信息处理方式,用事件驱动的尖峰神经网络实现超低功耗的实时处理。IBM的TrueNorth这一早期代表性系统,在模式识别任务中整片芯片运行功耗约为70毫瓦,研究和官方资料都用“接近常规微处理器功率密度的万分之一”来形容其能效优势。德国海德堡大学的 BrainScaleS 系统采用模拟混合信号电路直接模拟神经动力学,在加速模式下可以比生物时间快约三数量级,在特定实验配置中甚至报告过接近一万倍的加速因子。这类神经形态系统的共同特点,是通过存算一体与事件驱动编码,尽量减少存储与处理单元之间的数据搬运,从而缓解冯·诺依曼结构中“内存墙”带来的能耗与延迟问题——有研究指出,在某些AI工作负载中,数据在存储层级间的迁移可能占据系统能耗的绝大部分。
量子计算则代表了另一条仍处在早期阶段的技术路径。虽然现有量子计算机距离通用、稳定的工程实用还有显著差距,但在特定优化问题与高维概率分布建模上,量子增强算法被认为可能提供超出经典体系的潜在优势。一些前沿研究提出,将量子比特与神经形态或类脑架构结合,有机会在处理复杂高维数据时展现新的性能区间,目前更多还停留在小规模实验层面。光子量子计算试图把光学计算的高速低损耗与量子计算的并行叠加能力结合起来。
值得注意的是,这些技术路线之间的关系,更大的可能是长期并存乃至最后逐步融合。一个可能的未来图景之一是:训练阶段主要依托大规模GPU或专用加速集群,推理阶段在功耗敏感场景由ASIC或神经形态芯片承载,在特定生成任务中调用光学或光子加速器,而在某些极端优化或模拟问题上借助量子协处理器。这意味着异构计算将成为常态,而系统集成、任务调度和跨架构编程模型的创新,其重要性可能不亚于单一芯片本身的性能突破。也正因为如此,业界对OpenCL、SYCL等面向多硬件后端的异构编程框架持续投入,希望为这种“多物理载体共存”的格局提供更平滑的开发抽象。
我们还应该看到的是,技术路径的多元化也自然带来了竞争格局的复杂化。没有任何一家企业能够在GPU、ASIC、存算一体、神经形态、光子与量子等所有赛道上同时保持长期领先,更现实的情形是围绕不同应用与物理范式形成若干细分领域的“局部领军者”。英伟达在GPU加速上的优势,未必会自动延伸到神经形态或量子增强系统;同样,专注光子计算的公司也未必能在类脑架构里占主导。对国家而言,中国企业有可能在部分新兴架构上形成突破,例如这次AI芯片LightGen的丰硕成果,但在其他领域仍需要追赶。在这种高度分化的体系下,简单用“谁领先谁落后”来下结论往往失真,也使得任何试图依靠出口管制或技术封锁来“永久锁定优势”的想法变得不切实际。技术本质上是一条不断分叉的演化路径,其具体走向常常难以预判。在这种环境中,保持技术生态的开放度、鼓励多样化探索,并通过国际合作机制降低系统性风险,往往比在某一时间点的“绝对领先”更有长期价值。
四、长期竞争的本质:创新能力而非单点突破
《大西洋月刊》2024年的一篇文章曾基于“美国公司占据全球芯片市场的一半,而中国仅占7%,并且这一差距在代表未来产业的先进AI芯片领域更为显著”,断定中国在半导体领域将会长期落后于美国和其他发达经济体。文章强调这样一个逻辑:任何后来者都面临的挑战是,当你努力缩小差距时,差距本身也在不断向前移动。这不仅是中国面临的挑战,也是所有试图挑战现有领导者的公司和国家面临的挑战。但文章没有看到的事实是,半导体行业的历史充满了领导者易主的故事——从英特尔在CPU领域的统治到被AMD挑战,从日本在DRAM市场的主导到被韩国超越,没有任何领先是永久的。
LightGen的研究成果在《科学》杂志发表,已说明中国在基础研究方面的投入已经开始产生世界级的成果。后面的重点考验的是建立持续创新的体系能力,这是如何让成果开花结果的关口。这种能力包括基础研究的投入、高水平人才的培养、产学研合作机制的建立、知识产权的保护、风险投资的活跃、市场反馈的快速响应,以及容忍失败的文化氛围。我们需要正视,美国有今天的科技优势的一大原因在于成熟的创新生态系统——从斯坦福、MIT等顶尖大学到硅谷的创业文化,从DARPA的高风险研究资助到活跃的风险投资,从开放的学术交流到严格的知识产权保护。
同时,我们也应该看到,当下的全球化的半导体产业链是长期国际合作的产物。台积电的先进制程依赖于ASML的极紫外光刻机,ASML的光刻机依赖于德国蔡司的光学系统和日本信越化学的光刻胶,而AI芯片的设计又离不开Synopsys和Cadence的EDA工具。美国政府出口管制和技术脱钩在短期内给全球带来了很大困难,但长期来看,它也刺激了其他国家加速自主创新的步伐。最终的结果可能导致平行生态系统的出现,而非一方的永久领先。
AI芯片竞争大概率会走向一个“多种技术路线并存,多个区域市场发展出各具特色的生态系统,国际合作与本土创新并重,开放竞争与标准协调同步进行”的新阶段。在这之中,LightGen式的突破会不断出现——有时来自中国,有时来自美国或欧洲;有时在大公司,有时在初创企业;有时在GPU领域,有时在光学或神经形态芯片。每一次突破都会推动整个行业向前,也会重新洗牌竞争格局。没有谁能永远保持绝对领先,也没有谁注定永远落后。竞争的本质不是零和博弈,而是在持续的技术进化中不断寻找新的可能性、开拓新的应用场景、创造新的价值。这是一场没有终点的马拉松,而所有认真对待这场竞赛的参与者,都有机会在某个阶段、某个领域领跑一段距离。
结语
在光的速度与电子的流动之间,在硅基芯片与新材料之间,在商业竞争与国际合作之间,AI芯片的未来正在被书写。这个未来不属于任何单一的技术路线或国家,而属于所有愿意投入、敢于创新、持续进化的参与者。竞争的终极意义不是谁能永久压制谁,美国将其简化为卡脖子的方式,既不符合技术发展的复杂现实,也无助于各方制定有效的长期策略,对其自身的反噬当下已经初步显现。应将AI芯片的发展置于人类命运共同体的框架内,在竞争中“推动技术进步、拓展应用边界、创造人类福祉”的观念不可或缺。从这个意义上说,我们需要的不是一场胜负已定的竞赛,而是一场永不停息的人类文明进化之旅。■
扫码入群可参加全年至少12场精彩闭门研讨
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.