网易首页 > 网易号 > 正文 申请入驻

从算力、推理、成本看 AI 接下来的几年

0
分享至

本文探讨了AI发展的三个关键观点:缩放定律依然有效但受到成本和产品形态的约束;推理能力的提升为大模型带来了真正的增长飞轮;成本、算力和电力成为决定AI胜负的关键因素。

———— / BEGIN / ————

起因是看了一位海外的科技投资人写的长文,总结了他对当下和未来的一些判断,因为原文太硬核,我抽出了几个观点,用更好懂的方式和大家聊聊:


  • 缩放定律还活着,AI 没有「撞天花板」,只是换了一个加速方式;

  • 推理能力改变了大模型的商业逻辑,让 AI 终于拥有了真正的「增长飞轮」;

  • 成本、算力和电力,第一次真正变成了决定 AI 输赢的底层变量。


缩放定律没死,只是效果被遮住了

先解释一个最近大家经常听到的概念:缩放定律(Scaling Law)。

简单说就是:在一定范围内,你给模型更多的算力、更大的模型规模、更好的数据,性能大概率会持续提升,而且提升和投入之间有相对稳定的关系。

过去几年,GPT 系列、Gemini 系列、Claude 系列,本质上都在用这个定律吃红利。

但过去一年有个现象:很多人觉得模型迭代没以前惊艳了。

比如:GPT-5 没有碾压上一代;各家新模型体验差不多,甚至有时候不如以前稳定。

于是就开始有人问:是不是缩放定律已经到头了?

那位投资人的观点是:不是定律失效,而是产品目标变了。

以 GPT-5 为例(他是从一线投资视角给的判断):

  • 它并不是尽可能堆料、追求最强性能的模型;

  • 而是刻意往便宜推理去设计,更像一个更小的模型 + 智能路由的组合;

  • 目标是:在成本可接受的前提下,给尽可能多的用户提供足够好的体验。


也就是说,产品团队踩了一脚刹车,不是引擎没办法再加速。

另一方面,像 Gemini 新一代模型在更大规模、更协调的算力集群上训练之后,性能还是有明显抬升,这说明:

在基础研究和预训练层面,缩放定律依然在发挥作用,只是现在多了一条「成本和产品形态」这条约束线。

对做产品、做投资的人来说,更重要的不是争论「有没有奇点」,而是承认一个现实:

  • 短期看,模型体验的提升确实不会像 2022 年那样一夜之间翻倍;

  • 长期看,只要算力和数据还能往上堆,AI 这条曲线还没到拐点。


一句话总结就是:

体验变平缓,不等于技术停滞;AI 现在更像是在从「炫技阶段」进入「算账阶段」。

推理能力,第一次给了大模型一个真正的增长飞轮

第二个被严重低估的点是:推理能力(reasoning)改变了大模型的商业逻辑。

以前的大模型,本质上更像一个高级自动补全:你给它一个问题、一个提示,它在训练好的概率分布上,选出最可能接下来的那一串字。

这种模式下,提升模型主要靠两件事:一是多花钱预训练;二是不断在互联网上捞更多数据。

问题是,这种只靠预训练的缩放方式,飞轮很弱:

  • 模型用得多 ≠ 模型变得更好;

  • 用户给你的数据,很多也只是一次性的对话记录,很难真正沉淀到产品里。


而现在的推理模型发生了什么变化?


  1. 它们开始具备了多步思考、拆解任务的能力;

  2. 它们可以在解决问题的过程中,自己生成链式推理过程、工具调用轨迹、错误修正记录;

  3. 这些过程本身,就可以被拿来再次训练模型,变成更高质量的「自己教自己」的数据。


这意味着什么?意味着我们终于有了一个闭环:

模型推理 → 产生结构化的高质量数据 → 喂回模型 → 模型推理更好 → 吸引更多用户 → 产生更多数据……

这其实就是互联网行业最熟悉的那个飞轮:

「用户 → 数据 → 产品变好 → 更多用户」,只是这次发生在 AI 模型层。

这也是那位投资人强调的一点:

在只有预训练、没有推理的时候,AI 缺的就是这个飞轮;有了推理之后,前沿模型的护城河,开始变成「数据 + 使用频率 + 闭环设计」。

第一次,成本决定了谁赢:Token和电力

过去二十年,大部分科技巨头的成功,都不是靠最低成本取胜:

iPhone 从来不是最便宜的手机;某些 GPU 也不是最便宜的算力芯片。

但在这一轮 AI 里,那个投资人的感受是:

这是他职业生涯里第一次,成本如此关键。

原因很简单:

  • 大模型的产品在很大程度上就是 Token,也就是模型吐出的字、代码、回答;

  • 每产生一个 Token,背后都要烧电、烧显卡、烧网络;

  • 对云厂商和大模型公司来说,谁能以更低的成本,稳定地产生大量 Token,谁就拥有更厚的基础设施护城河。


这里有两个关键信号:

1. 比显卡数量更重要的,是显卡之间能不能好好协同。

很多人喜欢问:某家公司有多少 GPU?但在真正做大规模训练的人眼里,更重要的是:

  • 这些 GPU 是怎么连在一起的?

  • 一个集群里有多少是可以互相快速通信、像一个整体一样工作的卡?

  • 通信成本和失败率有多高?


所以,你看到他用的词不是「多少卡」,而是「coherent FLOPs」:大致可以理解为「真正能协同起来干活的有效算力」,而不是裸算力。

这就是为什么一些公司在同样的卡数下,能训练出更好的模型、用更低的成本提供推理服务,它们在网络拓扑、软件栈、机房电力和散热设计上,做了别人看不到的重投入。

2. 当电力成为瓶颈时,游戏规则只剩一句话:每一瓦能产出多少 Token

另一个被低估的变量是:电力。

拉起一个大型 AI 数据中心,不只是买一堆机柜那么简单:

  • 你要有足够的变电、配电能力;

  • 要满足当地对能耗、碳排、用电稳定性的各种要求;

  • 很多地方现在已经开始对大型 AI 项目的用电做严格审批。


那位投资人的观点反而是:这是个好事。

一是因为电力瓶颈会自然减缓 AI 基础设施的过度扩张,避免一哄而上、然后一地鸡毛;

二是让整个周期变得更平滑、更长,而不是短期暴涨暴跌。

在电力受限的世界里,决策公式会变得非常简单粗暴:每 1 瓦电,我能产出多少有效 Token?

如果某个 GPU 贵一点,但每瓦电产出的 Token 多很多,它反而是更好的选择;

反之,即便某些方案在购置成本上便宜一点,但电力效率太差,长期 ROI 反而更低。

这对创业者同样有启示:

做应用层产品时,不要只看API 调用单价,还要关心在你的任务上,这个模型需要多少 Token 才能完成。

最后,站在一个更长的时间轴上看 AI。真正值得思考的,不是会不会是泡沫,而是:


  • 在你的行业里,有没有哪一块高频、可结构化、值得自动化的决策,还没有被 AI 接管?

  • 你能不能设计出一个越用越聪明的闭环,而不是一个用完就算的工具?

  • 在一个算力、电力不再廉价的世界里,你做的每一个AI功能,真的值得那几度电吗?


以上,祝你今天开心。

本文来自公众号:Fun AI Everyday 作者:张艾拉

2025AI产品大会,将于12月20-21日在深圳开幕!

聚焦“AI+行业”的落地实践,分享AI在物流、音视频、内容、数字化、工业制造、大数据、协同办公、出海、具身智能、智能硬件等等领域的具体案例。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国货船通过霍尔木兹海峡,伊朗:仅针对美以欧…

中国货船通过霍尔木兹海峡,伊朗:仅针对美以欧…

观察者网
2026-03-05 18:05:08
真只死了6个?曝美军承包商紧急招聘数名临时工,专门处理阵亡士兵物品

真只死了6个?曝美军承包商紧急招聘数名临时工,专门处理阵亡士兵物品

不掉线电波
2026-03-06 10:00:34
安徽大学有学生研究哈梅内伊思想

安徽大学有学生研究哈梅内伊思想

深度报
2026-03-05 22:44:32
38+16+5帽还0失误!文班亚马再显顶级天赋刷纪录 马刺近14战13胜

38+16+5帽还0失误!文班亚马再显顶级天赋刷纪录 马刺近14战13胜

颜小白的篮球梦
2026-03-06 11:39:24
杜兰特23分6板火箭OT不敌勇士,波杰26分9篮板谢泼德30分

杜兰特23分6板火箭OT不敌勇士,波杰26分9篮板谢泼德30分

湖人崛起
2026-03-06 11:23:50
多家车企大降价,我听到一片欢呼

多家车企大降价,我听到一片欢呼

新行情
2026-03-05 15:00:34
阿里决绝“干掉”林俊旸,一场关于千问“集体叛逃”的误读

阿里决绝“干掉”林俊旸,一场关于千问“集体叛逃”的误读

一视财经
2026-03-05 21:21:03
欧洲下达了 “逐客令”,C919下调15米标准,不是妥协而是破局!

欧洲下达了 “逐客令”,C919下调15米标准,不是妥协而是破局!

阿纂看事
2026-03-05 11:54:48
暴涨819%后买在山顶,满仓硬扛竟亏近5万

暴涨819%后买在山顶,满仓硬扛竟亏近5万

财经智多星
2026-03-05 12:18:48
KD加时连丢两罚 火箭输勇士送温暖!湖媒怒喷:史上最假西部第三

KD加时连丢两罚 火箭输勇士送温暖!湖媒怒喷:史上最假西部第三

Emily说个球
2026-03-06 11:27:57
6天崩盘:伊朗“打几个月”的豪言为何瞬间破产

6天崩盘:伊朗“打几个月”的豪言为何瞬间破产

斌闻天下
2026-03-05 22:52:36
万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

万万没想到!两会最火提案不是医疗和就业,而是霍启刚的这一举动

查尔菲的笔记
2026-03-05 20:24:50
全网炸了!骨折傅盛直播翻车:龙虾3分钟救场,10万人看懵了

全网炸了!骨折傅盛直播翻车:龙虾3分钟救场,10万人看懵了

新智元
2026-03-05 15:37:16
全国政协委员张凯丽:建议统一并简化演员署名体系,扭转“唯番位论”畸形风气

全国政协委员张凯丽:建议统一并简化演员署名体系,扭转“唯番位论”畸形风气

封面新闻
2026-03-05 12:24:38
亡母被结婚后续:舅舅曝光炸裂,错换人生,以擦边主播谋生再翻身

亡母被结婚后续:舅舅曝光炸裂,错换人生,以擦边主播谋生再翻身

离离言几许
2026-03-05 16:57:11
物理学停滞100年,三座大山难以逾越!或许永远都无法进步?

物理学停滞100年,三座大山难以逾越!或许永远都无法进步?

心中的麦田
2026-03-03 20:19:10
“160万江景房里最窒息的一幕”,炸出了多少心穷的中国家长

“160万江景房里最窒息的一幕”,炸出了多少心穷的中国家长

小椰子专栏
2026-03-03 13:02:56
又一闫学晶浮现!过气女星直播哭穷,每月开销6位数,仍然不满足

又一闫学晶浮现!过气女星直播哭穷,每月开销6位数,仍然不满足

潮鹿逐梦
2026-03-05 15:23:41
数学物理双科150分!西安交大考研惊现物理大神,网友:牛顿重生

数学物理双科150分!西安交大考研惊现物理大神,网友:牛顿重生

火山詩话
2026-03-06 05:39:34
美国土安全部部长被解职

美国土安全部部长被解职

大风新闻
2026-03-06 08:02:03
2026-03-06 11:47:00
人人都是产品经理社区 incentive-icons
人人都是产品经理社区
想要成为大牛先从学做产品开始
64493文章数 311549关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

特朗普强势要求赦免内塔尼亚胡 曾公开贴心为其推椅子

头条要闻

特朗普强势要求赦免内塔尼亚胡 曾公开贴心为其推椅子

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

黄金,牛市没了?!

汽车要闻

710km长续航+闪充 宋Ultra EV预售15.5万起

态度原创

亲子
艺术
手机
公开课
军事航空

亲子要闻

咋回事呢,奇怪了

艺术要闻

敦煌壁画里的“动物世界”,温馨有爱!

手机要闻

vivo X300 Ultra首发3°光学防抖超大底长焦,重铸微云台时代荣光

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

2026年中国国防预算增长7%

无障碍浏览 进入关怀版