网易首页 > 网易号 > 正文 申请入驻

下给英伟达的新年战书,“小”芯片公司们喜迎2025年

0
分享至

文|适道

2025年,有多少人想看英伟达楼塌了?

醒醒,这不太现实。

不过,2025年的AI算力市场或将迎来转变。

一方面,行业重点将从"训练模型"转向"模型推理",意味着对推理基础设施的需求呈现上升趋势。例如,无论是OpenAI的o1和o3模型,还是Google的Gemini 2.0 Flash Thinking,均以更高强度的推理策略来提升训练后结果。

另一方面,训练好的大模型需要通过AI推理才能落地到各类场景中,随着千行百业的深入采用,AI工作负载格局将发生转变。例如,Open AI创建Sora代表着AI训练,而用户让Sora生成一段视频则代表着一个推理工作负载。

换句话说,大规模训练工作负载是"研发阶段",推理工作负载是"商业化阶段",你想在AI领域赚钱,就要扩大推理工作负载。

巴克莱研报显示:目前,AI推理计算需求将快速提升,预计其将占通用人工智能总计算需求的70%以上,推理计算的需求甚至可以超过训练计算需求,达到后者的4.5倍。

2025年,这些演变将为自身"推理"过硬的"小"芯片公司提供发育空间。

这不,别人赶着新年送祝福,而Groq、SambaNova、Positron AI等专注于推理的初创公司则是向霸主英伟达纷纷亮出了虎牙。

一次讲透推理芯片&训练芯片

如果我们将AI训练比作 让模型"考驾照",那么推理就是让模型"上路"。

训练阶段,你要请"教练"(优化算法)"指导"(反向传播和参数调整)模型;推理阶段,"驾驶员"(模型)要基于自己学到的知识技能,灵活应对实际路况。因此,推理阶段只涉及前向传播,通常比训练阶段更高效。

对应到芯片,训练芯片具备更高的计算能力,旨在支持训练过程中的大量计算和数据处理;推理芯片通常靠较少的计算能力完成工作。

问题一:为什么不用传统CPU进行推理?

答:牛也能当交通工具,但速度太慢。

问题二:为什么不继续用GPU做推理任务?

答:直升机也是通勤工具,但成本太高,而且你还得找停机坪。

虽然GPU非常适合实现神经网络的训练工作,但它在延迟、功耗等方面表现不算最佳,留给竞争对手一些遐想空间。

我们都知道,AI推理要求模型在作答前先进行"思考"——"思考"越多,答案越好。然而,模型的"思考"同时也伴随着时间的流逝,以及资金的消耗。

因此,"小"芯片公司的主线任务则变成——优化"思考"所消耗的时间成本,或是资金成本中的任何一项,就能建立自身护城河。

挑战者联盟都说了些啥?

这次放话的挑战者分别是Groq、SambaNova,以及Positron AI。

前二位的名声更大一些。

先说Groq,这家创企由前谷歌TPU核心团队的"8叛将"于2016年创办,平时喜欢在官博"喊麦",代表作为《Hey Zuck...》《Hey Sam...》《Hey Elon...》等等。

当然,Groq的实力还是不容小觑,其AI推理引擎LPU号称做到了"世界最快推理",不仅有超快的大模型速度演示,还有远低于GPU的token成本。

2023年7月,Groq甩出了LPU的推理速度,运行Meta的Llama 3 80亿参数大模型,每秒超过1250个token。

2024年12月,Groq推出一款高性能计算芯片,名为"猛兽"(Beast)。据称,这头"猛兽"在AI推理任务中的性能超越英伟达的某些主流GPU;能够通过优化硬件设计,减少不必要的运算环节,大幅提升计算效率。

也正是2024年8月,Groq双喜临门,获得了6.4亿美元D轮融资,估值达28亿美元;其创始人Jonathan Ross请来杨立昆担任技术顾问。

Groq的LPU(线性处理单元)不同于GPU(图形处理单元),设计理念是解决传统架构中外部内存的瓶颈,通过将大量计算资源集中在片内共享内存中,实现数据流动的高效优化,避免外部内存的频繁调用。此外,LPU支持多个张量流处理器的串联扩展,规避了传统GPU集群中因数据交换带来的性能损耗。

对于2025年,Groq首席布道官Mark Heaps喊话:"我希望客户能认识到与现有技术相比的新进展。许多人对我们说,我们喜欢你们的技术,但没人因为选择某家传统供应商而被解雇。如今,市场已经开始变化,人们意识到从传统供应商处获得芯片并不容易,而且性能也未必如Groq的技术那样出色。我希望更多人愿意尝试这些新技术。"

不过,Groq要解决的真正问题是客户总体成本。

虽然创始人Jonathan Ross宣称:LPU速度比英伟达GPU快10倍,但价格和耗电量都仅为后者的十分之一。

但自称"Groq超级粉丝"的原阿里副总裁贾扬清对比了LPU和H100,他的结论却是:用Groq的LPU反而使硬件成本和能耗成本大幅度上升,在运行Llama2- 70b模型时,305张Groq才能等同于8张英伟达H100。

芯片专家姚金鑫也指出,Groq架构建立在小内存(230MB)、大算力上。按照当前对大模型的推理部署,7B模型大约需要14G以上的内存容量,为了部署一个7B的模型,大约需要70张左右。

此前一位自称Groq员工的用户表示,Groq致力于成为最快速的大规模模型硬件,并发誓三年内赶超英伟达。

第二位成员是SambaNova。

SambaNova的创立时间比Groq晚一年,如今却以50亿美元的估值身居AI芯片初创公司榜首。

SambaNova RDU既有GPU 10 倍以上的片上分布SRAM,也有适用于需要快速数据传输的大规模计算任务的HBM。(Groq则是摒弃了HBM,仅依赖SRAM进行计算。)其架构可以自动做到极致的算子融合,达到 90%以上的HBM利用率,使得RDU 对 GPU 有了 2-4 倍的性能优势。

值得一提,SambaNova在业务模式上颇具野心。公司不单卖芯片,而是出售其定制的技术堆栈,从芯片到服务器系统,甚至包括部署大模型。

联创Rodrigo Liang认为,大模型与生成式AI商业化的下一个战场是企业的私有数据,尤其是大企业。最终,企业内部不会运行一个GPT-4或谷歌Gemini那样的超大模型,而是根据不同数据子集创建150个独特的模型,聚合参数超过万亿。

目前,SambaNova已赢得不少大客户,包括世界排名前列的超算实验室,日本富岳、美国阿贡国家实验室、劳伦斯国家实验室,以及咨询公司埃森哲等。

对于2025年,Liang喊话:"对于SambaNova来说,关键是推动从训练到推理的转变。行业正快速迈向实时应用,推理工作负载已成为AI需求的核心。我们的重心是确保技术能够帮助企业高效、可持续地扩展规模。"

"如果我有一根魔法棒,我会解决AI部署中的电力问题。如今,大多数市场仍在使用设计上不适合规模化推理的高耗能硬件,这种方式在经济上和环境上都不可持续。SambaNova的架构已经证明有更好的解决方案。我们能耗仅为传统方案的十分之一,使企业能够在不突破预算或碳排放目标的情况下实现AI目标。我希望市场能更快地接受这种优先考虑效率和可持续性的技术。"

第三位是Positron AI。

Positron成立于2023年4月,名气相对较小。

2023年12月,Positron AI推出了一款推理芯片,声称可以执行与英伟达H100相同的计算,但成本仅为五分之一。

2024年10月,Positron AI还上榜了The information的《2024全球50家最具潜力初创公司榜》。

Positron CEO Thomas Sohmers表示:2024年,AI计算开支的重心已经转向推理,预计这种趋势将沿着"指数增长曲线"继续扩大。

对于2025年,Sohmers喊话:"我认为,如果我们能部署足够多的推理计算能力——从供应链角度看,我有信心能做到——那么通过提供更多专用于推理的计算资源,我们将能够推动‘链式思维’等能力的广泛采用。"

据悉,Positron的愿景是让人人负担得起AI推理。对此,Sohmers的新年愿望是:"我想做同样多的事情来鼓励使用这些新工具来帮助我的妈妈。我进入技术领域的部分原因是因为我希望看到这些工具帮助人们能够利用他们的时间做更多的事情——学习他们想要的一切,而不仅仅是他们从事的工作。我认为降低这些东西的成本将会促进这种扩散。"

结语

面对四面八方的挑战者,英伟达似乎无暇顾及。

前几天,英伟达为推理大模型打造的B300系列出炉——高算力,相比B200在FLOPS上提高50%;大显存,192GB提升到288GB,即提高了50%。

B300将有效地提升大模型的推理性能:每个思维链的延迟更低;实现更长的思维链;降低推理成本;处理同一问题时,可以搜索更多样本,提高模型能力。

根据半导体"牧本周期"——芯片类型有规律地在通用和定制之间不断交替——在某个特定时期内,通用结构最受欢迎,但到达一定阶段后,满足特定需求的专用结构会奋起直追。

当前,英伟达所代表的通用结构时代正处于颠覆。

更何况,英伟达早已全面开花。除了专为云计算、5G电信、游戏、汽车等领域客户构建定制芯片。2025年上半年,英伟达还将发布其最新一代人形机器人芯片Jetson Thor。

所以,最后还是那句话:不要想着干掉英伟达,而是去做英伟达之外的事。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
FCC一纸禁令:60%家用路由器将被断供,你的Wi-Fi要涨价了

FCC一纸禁令:60%家用路由器将被断供,你的Wi-Fi要涨价了

赛博兰博
2026-03-25 14:31:11
“穿着一年的收成扶贫?”女村干部下乡视频走红,网友:够举报了

“穿着一年的收成扶贫?”女村干部下乡视频走红,网友:够举报了

林林先生
2026-02-07 09:00:03
没想到!老公吃了半个月核桃壳煮鸡蛋,晚上猛如虎,再也不喊腰疼

没想到!老公吃了半个月核桃壳煮鸡蛋,晚上猛如虎,再也不喊腰疼

萧狡科普解说
2026-03-21 03:26:16
这7种家电坏了没必要修,维修成本太高,换个新的还更便宜

这7种家电坏了没必要修,维修成本太高,换个新的还更便宜

室内设计师有料儿
2026-01-04 13:52:50
11岁华人男孩被白人继父拐走,双双坠崖身亡!给母亲留下一句“你不配做妈妈”

11岁华人男孩被白人继父拐走,双双坠崖身亡!给母亲留下一句“你不配做妈妈”

发现新西兰
2026-03-26 12:46:52
梅根与哈里王子的公关危机:第五年迎第11位专员辞职,意味着什么?

梅根与哈里王子的公关危机:第五年迎第11位专员辞职,意味着什么?

智慧生活笔记
2026-03-27 04:02:21
网友在三亚偶遇张柏芝,这张脸真是“时代眼泪”

网友在三亚偶遇张柏芝,这张脸真是“时代眼泪”

今古深日报
2026-03-24 10:38:16
女孩昏迷3周,脑子里却过了7年!她在梦中养大俩娃,醒来崩溃了:娃全没了...

女孩昏迷3周,脑子里却过了7年!她在梦中养大俩娃,醒来崩溃了:娃全没了...

英国那些事儿
2026-03-25 23:12:57
央视发文,60岁释永信再迎噩耗,被他害惨的4个明星也出了口恶气

央视发文,60岁释永信再迎噩耗,被他害惨的4个明星也出了口恶气

阿雹娱乐
2026-03-26 09:05:22
湖北气温直冲26℃!随后大逆转,外套先别收

湖北气温直冲26℃!随后大逆转,外套先别收

鲁中晨报
2026-03-26 19:57:02
河南三个大爷自驾三轮车出游106天,总里程超3000公里,平均年龄超75岁!游历八省,分工明确,当事人:出发前约定互不追责,子女签字见证

河南三个大爷自驾三轮车出游106天,总里程超3000公里,平均年龄超75岁!游历八省,分工明确,当事人:出发前约定互不追责,子女签字见证

大风新闻
2026-03-25 19:23:14
伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

财联社
2026-03-26 18:29:05
央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

西门老爹
2025-12-16 15:35:31
父母让我把房给弟弟,我转给了儿子,五天后他们上门讨说法

父母让我把房给弟弟,我转给了儿子,五天后他们上门讨说法

晓艾故事汇
2026-03-26 17:21:54
全国高速明天大调整!车主集体欢呼:早该这么干了

全国高速明天大调整!车主集体欢呼:早该这么干了

沙雕小琳琳
2026-03-26 02:05:39
约基奇23+21+19创纪录!掘金险胜独行侠 穆雷53+9三分赛季新高

约基奇23+21+19创纪录!掘金险胜独行侠 穆雷53+9三分赛季新高

醉卧浮生
2026-03-26 12:35:12
广东一男子中奖500万:每次购彩金额控制在20元以内,是日常娱乐休闲方式

广东一男子中奖500万:每次购彩金额控制在20元以内,是日常娱乐休闲方式

大象新闻
2026-03-26 21:45:05
我国癌症高发,电饭煲是“帮凶”?医生:7种省钱行为要不得

我国癌症高发,电饭煲是“帮凶”?医生:7种省钱行为要不得

大象新闻
2026-03-24 13:53:11
狠砸 8700 万!阿森纳截胡热刺,锁定 19 岁无解妖锋

狠砸 8700 万!阿森纳截胡热刺,锁定 19 岁无解妖锋

澜归序
2026-03-27 04:32:50
46 岁张柏芝三亚生图流出,肚子上的软肉,打了整个内娱的脸

46 岁张柏芝三亚生图流出,肚子上的软肉,打了整个内娱的脸

橙星文娱
2026-03-26 13:40:27
2026-03-27 05:31:00
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
128972文章数 193777关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
艺术
本地
亲子
公开课

教育要闻

2026年高考可能“扎堆报考”的五大专业:就业缺口大,稳定且高薪

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版