网易首页 > 网易号 > 正文 申请入驻

80亿参数模型成新宠,模型轻量化浪潮下,边缘智能设备迎爆发期

0
分享至

在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!

声明:本文内容均是根据权威材料,结合个人观点撰写的原创内容,辛苦各位看官支持。

文丨夕逸

编辑丨姣可

2026年初,芯片圈炸了个大新闻:英伟达掏出200亿美金,拿下了创业公司Groq的推理技术授权。

这事儿乍一看是笔普通收购,仔细琢磨才发现,通用GPU统治AI行业近十年的日子,怕是真要翻篇了。

英伟达以前在AI圈的地位,就像奶茶店的珍珠,几乎所有AI模型训练、推理都得用它家GPU。

但这两年情况变了,AI推理的活儿越来越细分,通用GPU有点“万能钥匙开所有锁”的尴尬,有的锁需要大力拧(计算密集),有的锁需要快手开(低延迟),硬用一把钥匙,效率低不说,成本还高得吓人。




从HBM到GDDR7:英伟达的“成本减法”与“效率加法”

推理这事儿,拆开来看其实分两步:预填充和解码。

预填充就像老师备课,得把一整本教材(比如10万行代码、1小时视频)吃透,需要海量并行计算,这时候GPU的优势还在,但解码就不一样了,它是逐字逐句“讲课”,每生成一个词、一个指令,都得快速调用之前的“备课笔记”,对内存带宽敏感得很。

以前英伟达用HBM内存解决带宽问题,但这玩意儿比黄金还贵,还老缺货。



2025年Weka公司的数据显示,当AI模型要处理百万级上下文时,通用GPU效率直接掉了300%,键值缓存老掉链子,模型跟“失忆”似的。

英伟达自己也扛不住了,今年推出的VeraRubin芯片,干脆把HBM换成了GDDR7内存,这步棋挺妙。

GDDR7成本降了60%,数据吞吐量还能达到HBM的80%,专门对付长语境任务,比如律师分析几百页合同、设计师渲染3D模型。

Supermicro的技术白皮书里说,这芯片能覆盖80亿参数以下的小模型,从物联网设备到机器人控制,算是把边缘计算和数据中心的空白填上了。



等于说,英伟达用“成本减法”换来了“效率加法”,性价比一下子上去了,光解决预填充还不够,解码的“速度病”得靠Groq的技术来治。

Groq的芯片用了SRAM内存,这玩意儿直接跟处理器刻在一起,数据传输能耗是DRAM的1/20到1/100。

微软M12基金测算过,用它做解码,词元生成延迟能压到纳秒级,英伟达把这技术整合过来,等于给AI装了个“极速引擎”。

SRAM芯片让AI反应快过人类:自动驾驶和语音助手的福音



这技术一落地,咱们生活里的AI体验立马不一样。

以前跟语音助手说话,得等半秒以上,现在150ms以内就能响应,感觉像跟真人聊天,自动驾驶更关键,遇到突发情况,AI决策指令生成延迟降了70%,比人类反应还快,这可不是闹着玩的,直接关系到安全。

金融圈也乐坏了,高频交易的AI顾问,合规话术得实时生成,以前用GPU老卡壳,现在用Groq技术,毫秒级响应,错过行情的概率小多了。

这些场景以前都是通用GPU的“短板”,现在英伟达等于把短板补成了长板,这200亿花得不算亏。



当然,英伟达没忘了自己的“护城河”,CUDA生态。

它搞了个Dynamo框架和KVBM系统,相当于给AI任务装了个“智能调度中心”,预填充的活儿分给VeraRubin芯片,解码的活儿分给Groq技术,边缘小模型就用老款GPU,分工明确。

2025年《AI架构迁移报告》里说,开发者想从CUDA转到别的平台,一个项目平均要花120万,这壁垒,对手想破可不容易,不光英伟达,整个行业都在跟着变天。

Meta年初收购了Manus,专门解决AI代理“失忆”问题,Anthropic的Claude模型现在能在英伟达GPU和谷歌TPU上跑,不再绑死一家,谷歌TPU靠着TensorFlow生态占了35%的训练市场,特斯拉AI5盯着自动驾驶,每瓦算力密度比行业高40%。



2026年的AI芯片圈,怕是要从“一家独大”变成“三国杀”了。

对企业来说,现在选AI硬件不能瞎买了,得学会给任务“贴标签”:长语境还是短语境?交互型还是批处理?然后找对应的芯片。

德勤预测,这么做的企业推理成本能降45%,金融行业最划算,能省58%,制造业也能省42%。

说到底,通用GPU时代落幕,不是英伟达不行了,而是它主动给自己“拆台”再“搭台”。



未来AI竞争,比的可能不是谁芯片算力强,而是谁能把每个推理任务精准“路由”到最合适的硬件上。

就像当年英特尔没抓住移动芯片,现在AI行业的赢家,大概率是那些把“每个词元该在哪运行”琢磨透的玩家。

英伟达这200亿,押的其实是“效率革命”的未来,毕竟,AI从“能用”到“好用”,还差最后一公里的效率账。

不知道您对此有什么看法呢?欢迎在下方评论区留下你的想法,喜欢文章记得点赞关注我们下期再见。

[免责声明]文章的时间、过程、图片均来自于网络,文章旨在传播正能量,均无低俗等不良引导,请观众勿对号入座,并上升到人身攻击等方面。观众理性看待本事件,切勿留下主观臆断的恶意评论,互联网不是法外之地。本文如若真实性存在争议、事件版权或图片侵权问题,请及时联系作者,我们将予以删除。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
放过保时捷,咱换一家抄好不好?

放过保时捷,咱换一家抄好不好?

爱范儿
2026-01-08 18:16:20
一名美国公民在拍摄ICE执法,离开时被连开3枪当场击毙,随后街头失控,催泪弹清场...

一名美国公民在拍摄ICE执法,离开时被连开3枪当场击毙,随后街头失控,催泪弹清场...

北美省钱快报
2026-01-08 08:14:39
豪门对决夜 皇马2-1马竞进决赛 巴黎6-3马赛夺冠 阿森纳0-0利物浦

豪门对决夜 皇马2-1马竞进决赛 巴黎6-3马赛夺冠 阿森纳0-0利物浦

狍子歪解体坛
2026-01-09 05:59:59
罕见!各地密集设立超常规机构,级别前所未有

罕见!各地密集设立超常规机构,级别前所未有

前瞻网
2026-01-07 09:45:12
国家明确2026债务新规!这6种债直接作废,欠债人可以不用还了?

国家明确2026债务新规!这6种债直接作废,欠债人可以不用还了?

今朝牛马
2026-01-08 16:52:13
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
委内瑞拉外长发文再次对中国支持表示感谢

委内瑞拉外长发文再次对中国支持表示感谢

新京报
2026-01-09 07:16:02
两部门:做好职工基本医疗保险个人账户跨省共济工作

两部门:做好职工基本医疗保险个人账户跨省共济工作

界面新闻
2026-01-09 08:03:43
美俄对峙,俄罗斯怂了,俄油轮被美军扣押

美俄对峙,俄罗斯怂了,俄油轮被美军扣押

山河路口
2026-01-08 12:19:03
对重伤球员施暴!阿森纳红星遭狂喷:可耻逃红 利物浦全队该揍他

对重伤球员施暴!阿森纳红星遭狂喷:可耻逃红 利物浦全队该揍他

我爱英超
2026-01-09 07:51:15
42+35+33!33+32+30!NBA一生之敌诞生,最佳新秀要失去悬念了

42+35+33!33+32+30!NBA一生之敌诞生,最佳新秀要失去悬念了

世界体育圈
2026-01-08 10:20:39
阿根廷大逆袭!米莱执政两年,通胀暴跌,经济增速扭负为正!

阿根廷大逆袭!米莱执政两年,通胀暴跌,经济增速扭负为正!

百态人间
2026-01-07 16:41:49
队记:这是杨瀚森本赛季打得最好的一场 真正做到了能被教练用上

队记:这是杨瀚森本赛季打得最好的一场 真正做到了能被教练用上

罗说NBA
2026-01-09 07:36:38
四川高县一村支书暴打残疾村妇致轻伤二级!法院:免于刑事处罚!

四川高县一村支书暴打残疾村妇致轻伤二级!法院:免于刑事处罚!

兵叔评说
2026-01-07 12:13:15
闫学晶事件再升级!官媒下场发文锐评,言辞犀利,句句直戳她心窝

闫学晶事件再升级!官媒下场发文锐评,言辞犀利,句句直戳她心窝

揽星河的笔记
2026-01-07 16:04:46
以为是假新闻其实是真新闻,从袁立到王星,件件离谱又惊人

以为是假新闻其实是真新闻,从袁立到王星,件件离谱又惊人

上官晚安
2026-01-06 08:08:35
涉嫌严重违纪违法!丹阳市水利局原党组副书记、副局长许立新接受纪律审查和监察调查

涉嫌严重违纪违法!丹阳市水利局原党组副书记、副局长许立新接受纪律审查和监察调查

扬子晚报
2026-01-08 17:48:33
这次不一样了:美国扣押俄国油轮,最受伤的不是俄罗斯

这次不一样了:美国扣押俄国油轮,最受伤的不是俄罗斯

十柱
2026-01-08 12:55:50
网传某国产操作系统大厂老董开除核心工程师,理由竟是 “没穿西装”

网传某国产操作系统大厂老董开除核心工程师,理由竟是 “没穿西装”

可达鸭面面观
2026-01-08 19:48:13
麻省理工研究警告:未来华北平原不宜人类居住!理论依据是什么?

麻省理工研究警告:未来华北平原不宜人类居住!理论依据是什么?

小熊侃史
2026-01-08 07:55:03
2026-01-09 08:24:49
我不叫阿哏
我不叫阿哏
分享有趣、有用的故事!
220文章数 6231关注度
往期回顾 全部

科技要闻

内存一天一个价,华强北老板们却高兴不起来

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

游戏
艺术
手机
本地
教育

《界之轨迹》IGN8分:战斗机制好评 结尾或存争议

艺术要闻

Sean Yoro:街头艺术界的“冲浪高手”

手机要闻

1699元起,续航性能拉满,一加刚发布的新机太狂了

本地新闻

1986-2026,一通电话的时空旅程

教育要闻

目标不一样,成绩就不一样

无障碍浏览 进入关怀版