最近国内的科技有点百花齐放的感觉了,去年是ds时刻,今年是sd时刻,但其实无论是什么,关键的一环是双边博弈,我们怎么能把这些AI工具用好,怎么去整合好我们的算力资源池子。
首先我们对于北美的应用环境是有优势的,一大原因就是人口,人口密度足以支持爆款的出现病实现出圈闭环,前提是要有能力。
![]()
智谱:全网寻找“算力合伙人”。
就是缺算力,其实这些在调研的过程当中,一直都是能感受到数据中心对于算力的强烈需求的,只是每当出现更多新的模型,新的超预期应用,这些对于算力缺口的拉动,就不是线性,而是指数型拉涨。
我以最近最火的seedance2.0为例子,昨晚凌晨1点依然很多人在等着生成视频,是要排队生成的,这里背后的基座就是算力支持。
而zj当然不希望放过这个机会,要知道海外的对seedance的期待更是高,他们太想来体验这一款爆款应用了,确实也是非常的让人惊艳,而zj的做法则是,把能用上的算力都先支持给上seedance2.0了,后面对于算力的新增需求就是可想而知了。
其实往更深层想,这两天zj自研asic的消息也不断被挖掘出来了,核心原因就是一个:要满足自身的需求+降本性价比。(越来越像是谷歌的模式了),只要走量产化模式,全生命周期单卡产出数量越多,边际成本是越来越低的,甚至测算过接近2-3万一颗的成本即可。
未来大厂可能都会去配置一部分的自研卡需求,因为可以自己用自己的算子结构,也可以做到适配+降本,能够自己做主。而其他的训练卡的需求也是很紧缺的,现在就处于一个很微妙的节点,需求很足,但是半导体制造端不出那么多的芯片,类似中芯,台积电的产能早就被预定满了。
所以从芯片端口的叙事就是:
1.厂家Capex的需求旺盛(训练端+推理端应用扩容,token涨价)
2.GPU/Asic/CPU需求指数型上升需求(量增价增)
3.为满足上述芯片需求,半导体制造设备扩产。
而AI硬件的端口叙事就是更多的芯片产生出来,所要去搭配的算传存架构就是同步的匹配,芯片越来越多这里继续拉动传力+存力的需求,同时技术迭代带来的带宽增长,也进一步带动传力+存力的新升级。
最近不止光互联有CPO产业新进度,存储产业的光进存储池,谷歌的CXL架构也是有新东西的。
有信息说谷歌正在尝试移除 HBM,设立 DRAM 内存机柜,通过 OCS 加 CXL 进行池化,展望这种技术路线清楚吗?
这个概念已经落地,目前正在寻找和 V8P 量产时间的契合度。这个方案比增加芯片密度(如从四颗变 12 颗)和交换 tray 的 NPO 需求更有可能,因为它是独立于芯片密度的,无论四颗、八颗、12 颗柜子,这个方案的通用性和兼容性更好,不取决于某块芯片密度增加。主要考虑 HBM 未来几年产能都紧缺,谷歌一年半前就已考虑这个方案,当时还不是因为HBM 缺,而是因为 HBM 性能上限固定。HBM 容量空间是固定的,板载后不能变。而这种方案可以把板载的固定性能上限变成动态可调整。
展望这个方案用的是 V8P 吗?
V8P 今年(2026 年)不可能,今年的柜子马上就要出了,不可能上这个方案。因为这个方案对 TPU 主板有改造,要把 HBM 拿下来,主板尺寸也要变化。HBM 拿下来后,位置可以放新芯片,会增加芯片密度,这和 V8P 想增加芯片密度的需求方向契合。从产品契合度和长线通用性需求来看,这个方案明年(2027 年)上量的可能性很高。但是否100% 交付,还要看谷歌近期的表态。如果谷歌在 2 月底前决定采用这个通用方案,3 月的一些公开大会或论坛上,应该会发布相关信息和详细方案介绍。和英伟达一起举办的会议,大概在 3 月份会有两到三个,分别在 3 月 5 号、6 号以及十几号都有相关会议。只要谷歌参加这些会议,并且在 2 月底前完成概念阶段、确定方案要上线的话,通常会进行一些市场预热,这也是谷歌一贯的发布习惯。例如,V7 发布时有市场宣传,但 V8AX 和 V8X 则没有任何消息。
如果不用 HBM 的话,展望是不是其实 CoWoS 的产能也没有那么紧张了?
是的,产能完全可以释放出来,满足谷歌等量 TPU 的使用需求。因此,谷歌在这个阶段考虑该方案,实际上有多方面的考量。
如果真的是做这种方案的话,您觉得哪些厂商有相关性?
目前国内外主要有三家:Rambus、ALab,以及国内的澜起。Rambus 主要做 IP 授权,提供知识产权,可能会以授权方式合作。根消息,谷歌正在寻找类 CXL 协议板的 EVB研发版供应商。从产品角度看,ALab 有可匹配的产品,而 Rambus 主要专注于存储接口协议,提供授权许可。因此,最终供应商可能会选择一家同时具备知识产权和产品能力的公司,还是由一家提供知识产权,另一家负责硬件产品合作?目前还未确定。如果从产品落地角度看,只有 ALab 有匹配产品;但从协议定制开发角度看,Rambus 的可能性更大。所以个人认为最终可能是多家合作,最后可能是授权协议加硬件代工的方式。谷歌目前还处于概念落地阶段,真正的产业落地模式要等到方案落地和制图阶段才会确定,现在这些信息仅供参考。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.