公众号记得加星标⭐️,第一时间看推送不会错过。
![]()
虽然在过去几年经历了从热捧到遇冷,但进入最近半年,英伟达挑战者们正在疯狂融资,今天就有两个巨头拿到了不少钱。例如,芯片初创公司 Cerebras Systems Inc.在完成11 亿美元的融资轮四个月后又在今天宣布,已从许多相同的投资者那里筹集了额外的 10 亿美元。
Tiger Global领投了Cerebras的H轮融资。其他投资者包括AMD、Fidelity Management、Atreides Management、Alpha Wave Global、Altimeter、Coatue、1789 Capital等。Cerebras目前的估值为230亿美元。
此次融资发生在几周前,据报道,该公司签署了一项价值超过100亿美元的协议,将向OpenAI Group PBC供应人工智能硬件。Cerebras生产的WSE-3人工智能芯片包含4万亿个晶体管,是英伟达Blackwell B200显卡晶体管数量的19倍。该处理器约一半的表面积用于容纳44GB的SRAM内存。
Cerebras公司表示,使用一块大型芯片而非多块小型显卡可以提高效率。WSE-3芯片的大容量内存池使其能够运行多个AI模型,而无需将数据移动到芯片外的HBM内存中。这避免了与数据在独立内存模块间传输相关的处理延迟,从而加快了处理速度。
芯片制造商历来不生产晶圆级处理器的原因是,晶圆级处理器制造难度大。芯片越大,其晶体管出现缺陷的可能性就越高。理论上,即使只有一个缺陷也可能导致处理器无法工作。
Cerebras 通过将 WSE-3 分割成 90 万个核心来应对这一挑战。如果某个晶体管存在制造缺陷,则只会影响到宿主核心,其他电路可以绕过它来路由数据。这种架构可以防止局部制造缺陷导致整个处理器短路。
该公司将 WSE-3 作为名为 CS-3 的水冷系统的一部分进行销售,该系统可提供 125 petaflops 的性能。据 Cerebras 称,客户可以将 2,048 台 CS-3 设备连接成一个集群,该集群的总计算能力可达 256 exaflops。这足以训练一个拥有 24 万亿个参数的大型语言模型。
Cerebras于2024年9月提交了首次公开募股(IPO)申请。该公司当时披露,其2024年上半年营收达1.364亿美元,较上年同期增长十倍以上。Cerebras的亏损额从7780万美元收窄至6660万美元。
这家芯片制造商去年撤回了IPO申请,理由是该文件“已经过时,不再反映我们目前的业务状况”。据Cerebras公司称,此举背后的原因之一是其2025年的收入显著增长。据报道,该公司计划重新提交IPO文件,目标是在第二季度上市。
Positron AI 融资 2.3 亿美元
为节能型人工智能推理制造定制硅芯片和硬件的Positron AI今日宣布,已完成超额认购的 2.3 亿美元融资,估值达 10 亿美元。
B轮融资由Arena Private Wealth、Jump Trading和Unless共同领投,卡塔尔投资局、Arm和Helena等新晋及战略投资者也参与了本轮融资。现有投资者Valor Equity Partners、Atreides Management和DFJ Growth等也参与了本轮融资。
“能源供应已成为人工智能部署的关键瓶颈,”首席执行官米特什·阿格拉瓦尔表示。“与英伟达即将推出的Rubin GPU相比,我们的下一代芯片在核心工作负载下每瓦特可提供的代币数量将增加五倍。”
阿格拉瓦尔继续将英伟达公司的Rubin人工智能芯片与图形处理器进行比较,指出内存是推理能力的下一个瓶颈。Positron公司开发的定制芯片Asimov将于2027年初出货,其单台设备的内存容量将超过2304GB,而Rubin仅为384GB。
阿格拉瓦尔表示:“这将成为视频、交易、数万亿参数模型以及任何需要庞大上下文窗口的应用场景的关键差异化因素。”他还补充说,他预计Positron的定制芯片在特定内存密集型工作负载的性价比方面将超越Rubin的产品。
英伟达在 CES 2026 上发布了其最新的旗舰 GPU 芯片Rubin,该芯片由 3360 亿个晶体管构成,在处理 NVFP4 数据时可提供约 50 petaflops 的性能。
Positron公司表示,他们正在构建一个基础设施层,旨在通过降低运行模型所需的成本和能耗,使人工智能能够大规模应用。该公司目前的产品是Atlas,这是一个完全采用美国制造的系统构建的、可快速部署和扩展的推理系统。
“内存带宽和容量是下一代模型扩展 AI 推理工作负载的两个关键限制因素,”SemiAnalysis LLC 的创始人兼首席执行官 Dylan Patel 表示,该公司是 Positron 的顾问和投资者。
该公司表示,Asimov 的设计理念源于人工智能模型的现实:它们对内存带宽的依赖程度远高于纯粹的计算能力。Asimov 的目标是在与 Rubin GPU 相近的实际带宽下,实现每个加速器 2TB 内存和每个 Titan 系统 8TB 内存。
在GPU和AI芯片市场,英伟达是当之无愧的霸主。据市场报告显示,尽管面临激烈的竞争,英伟达目前仍占据着约85%的市场份额,其竞争对手包括AMD和高通等。作为最接近的竞争对手,AMD的市场份额仅为7%,并且在2025年第三季度仅增长了0.8%,这足以说明英伟达目前在该领域的统治地位。
Positron AI 致力于打造专用人工智能硬件和软件,以大幅降低推理所需的能源成本。该公司表示,预计与 Asimov 的合作路线图将使其成为增长最快的公司之一,并为其带来强劲的商业动力。此前,该公司已与云计算、高级计算和对性能要求极高的行业的众多“前沿客户”开展合作,并已初见成效。
此外,该公司表示,它正在与包括 Arm Holdings plc、Super Micro Computer, Inc. 和其他关键技术和供应链合作伙伴在内的行业领导者构建生态系统,以发展其平台。
(来源:半导体行业观察综合)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4309期内容,欢迎关注。
加星标⭐️第一时间看推送
求推荐
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.