网易首页 > 网易号 > 正文 申请入驻

饥渴的大厂,面对大模型还需新招

0
分享至

文 | 王智远

昨天晚上,跟朋友聊起大模型。

他说现在各家都“卷”到一个新阶段,模型之间差距已经很小,只能用“遥遥领先”或者“吊打同行”这种词来形容。

从基准测试和数据来看,很多模型都远超 DeepSeek R1、GPT-4o,但继续往下比的空间已经不大了,真正的差异更多在使用方式上。

这让我开始思考:大模型竞争,是不是已经进入存量博弈阶段?

1

说到“存量”,就绕不开一个字:“卷”。不卷,哪来的存量?那问题来了:这个卷,到底在卷什么?

我觉得,表面看到的就三点:算力成本数据质量和场景渗透

以前大模型拼参数多,现在开始拼谁的成本低。

阿里家的 Qwen3,用“混合推理”的技术,简单问题用低算力能快速回答,复杂问题再慢慢思考,这样部署成本直接降到了 DeepSeek-R1 的 1/3 到 1/4。

腾讯混元 T1,3890 亿参数的模型,通过稀疏激活机制,算力利用率比传统模型提升了 30% 以上。

百度的文心大模型,虽然没公开具体成本,但它的推理速度在工业级场景里比竞品快 20%,也算是有自己的优势。

字节跳动没直接在公开场合提到过算力优化,但它通过抖音、今日头条的场景化落地,间接降低了通用大模型的部署压力。

所以,算力成本上,大家是看能不能在不牺牲性能的前提下,把成本降下来。

降下来之后呢?

关键还不能影响数据质量,卷谁的训练数据更硬核。

阿里家 Qwen3 训练数据量达到了 36 万亿 token,支持 119 种语言和方言,数据质量更有普适性。百度文心一言依托搜索、地图等产品,积累了海量的真实用户行为数据。

腾讯的混元则通过开源生态积累开发者数据,在游戏和内容生成领域有独特优势;字节跳动则利用抖音、今日头条的庞大流量池,捕捉用户偏好数据,让内容生成模型更接地气。

所以,数据质量的卷,是从“广度”到“深度”的升级,不仅要数据多,还要精准、垂直。

技术再强,不能解决实际问题,也只是“空中楼阁”,再看看场景渗透,谁更狠一些。

Qwen3 深耕电商、金融、医疗等垂直领域,通过定制化微调提供行业解决方案;百度文心一言是嵌入搜索、地图、智能音箱等产品,形成了“技术-场景-用户”的闭环。

腾讯的混元聚焦游戏和内容生产,通过混元3D等工具抢占多模态赛道;字节跳动是把大模型融入抖音和今日头条的内容生产流程,甚至用 AI 生成短视频脚本,直接打通了“技术-内容-流量”的链条。

看到了吗?场景渗透的卷,是从“技术堆叠”到“价值创造”的转型,谁能在细分场景里跑通商业模式,谁就能突围。

因此,我认为这个“卷”是:卷技术、成本、场景的三角博弈;算力成本决定了谁能撑到最后,数据质量决定了谁能跑得更稳,场景渗透决定了谁能活出差异化。

2

但这种“卷”,背后隐藏着一个更深层的矛盾:

当技术突破趋缓时,大家一个劲地开源、吊打同行,是不是意味着用这些手段,在掩盖真正的技术瓶颈?

我认为:是的。但不是完全没进步,而是技术方向有点小调整。

为什么这么说?

先说数据。阿里家的 Qwen3-235B-A22B,虽然总参数量有 2350 亿,但每次实际用到的参数只有 220 亿,激活效率才 9.4%。

什么概念,说白了,“轻量化”策略确实降低了成本,这是对原来那种“参数越多越好”模式的一种妥协。现在单纯堆参数已经没有太大的效果了。

再看看腾讯的混元 T1:

总参数量 3890 亿,激活参数量 520 亿,上下文长度也很长,但它的稀疏激活机制,本质上还是在想方设法在不牺牲性能的前提下,把参数规模压一压。

文心大模型就更不用说了。4.5 Turbo 总参数量 1970 亿,但每次推理最多用到 28 亿参数。这说明什么?

参数量已经不是唯一的衡量标准了,激活效率才是新的竞争点。这种调整不是在掩盖瓶颈,而是把技术突破的方向从“规模扩张”转向了“效率优化”。

然后,再看看技术优化路线,阿里直接赶在五一前,推出“快慢思考”混合推理。本质是什么?

想通过架构创新来缓解技术瓶颈。Qwen3 的“快思考”是用低算力处理简单任务,“慢思考”用高算力处理复杂任务,这是在对原来的 Transformer 架构进行适应和改造。

腾讯混元的 T1 也一样,官方说模型内存占用减少了 40%,性能提升了两倍;这种优化还是依赖 MoE 架构的稀疏激活机制,但也受限于硬件兼容性和算法复杂度。

所以,技术优化的核心目标是延长现有架构的生命周期;说白了,更像「技术瓶颈下的权宜之计」,而不是真正的突破。

结论很明显:

短期来看,参数激活效率、混合推理、MoE 架构这些优化确实缓解了算力成本压力,但改进只是对现有技术框架的修补。

长期来看,技术瓶颈没消失,变成了“效率瓶颈”、“场景适配瓶颈”。开源生态的普及为技术迭代提供了数据和场景基础,但真正的突破还得靠底层架构的创新。

所以,这波“卷”不是在掩盖技术瓶颈,而是在重新定义瓶颈的形态。技术进步的速度是慢了,但方向更明确了:聚焦在效率、成本和场景落地。

3

既然这样,问题就来了:

大厂在“模型卷”的浪潮里,到底该怎么找到“看家本事”?是继续在技术细节上抠来抠去,还是把精力放在怎么把技术用到实际场景里,或者去构建一个更大的生态呢?

我觉得,技术细节优化(比如调整激活参数、搞混合推理)确实能减轻算力的压力。

但说到底,优化的核心价值是让现有的架构能多撑一会儿。不过,这里面有个风险:技术带来的好处会比我们想象的更快地消失。

为什么这么说?举个简单的例子:

你买了一款新手机,一开始觉得电池续航特别厉害,比旧手机好很多,这就是技术红利。但用了一段时间后,你发现电池老化得很快,续航优势很快就没了,甚至比你预期的更早。这就是红利衰减速度超出预期。

换句话说,技术带来的优势不会一直持续下去,会逐渐减弱,减弱的速度比我们预想的更快。

有个研究,来自 DeepMind 的 Chinchilla 模型,提到通过参数补偿来降低剪枝带来的性能损失,可以在不依赖大规模后训练的情况下低成本压缩模型,提升推理速度,同时最大程度保留性能。

什么意思呢?

大模型的性能提升和算力投入之间的关系已经到了一个瓶颈阶段,有点像“帕累托最优”(Pareto Optimality)——再怎么努力,提升的空间也越来越小了。

说白了,现在大家都在过度依赖参数规模和稀疏激活机制,可能会陷入一种“技术幻觉”:以为解决了成本问题,其实并没有真正解决通用大模型的深层瓶颈。

换句话说,技术越来越同质化,竞争也越来越内耗。

文心一言的多模态能力虽在行业里领先,但核心还是依赖 Transformer 架构,没办法突破通用大模型的扩展性限制,这就是算法优化的天花板。

再比如,Qwen 系列虽然全球下载量突破 3 亿次,看起来很厉害,但实际上模型的功能差异很小。

那怎么办呢?各家短期直接把架构推倒,重新来过吗?肯定不可能。真正的路线是从“技术堆叠”到“价值创造”。

我觉得,对于大厂来说,价值锚点的核心在于能不能真正解决实际问题,而不是单纯追求技术指标的极致;很明显,技术细节优化只是手段,场景落地和生态协同才是根基。

就像艾媒咨询在 2024-2025 年中国 AI 大模型市场研究报告里提到的:谁能找到自己的“价值锚点”,谁就能在“下半场”突围。

4

所以,大家到底怎么才能突围呢?

现在看来,真正能落地到企业实际场景里的,是一个“三重共振”:云厂商 + 行业应用 + MCP 协议。

为什么说 MCP 是关键?因为它本质上是重新定义了企业与 AI 怎么合作的规则。

以前企业用大模型,就像给厨师一把刀,但没告诉他菜在哪、锅在哪、调料在哪——他只能靠猜。

现在有了 MCP,相当于给 AI 装了一个“导航系统”,它能自动找到企业的数据库、API、业务流程,甚至还能跨系统操作。

高德地图是阿里云的客户,如果接入 MCP,以后导航建议就不是简单的“绕开拥堵”,而是能结合用户的消费记录推荐周边餐厅,甚至直接跳转到外卖 App 下单。

这背后是 MCP 把高德的数据和阿里云的 AI 能力打通了。

那MCP到底怎么驱动ToB的范式变化?我认为,有两点:

一、从“模型为中心”变成“数据为中心”;以前企业做 AI,总盯着模型参数、推理速度这些技术细节。但 MCP 让重点转向数据流通 。

二、从“孤岛”变成“协同”;企业内部的系统通常互不联通,比如:财务系统、供应链系统、客户管理系统。一个公司用了谁家的云,云厂商就可以基于 MCP 把这些系统全打通。

打通之后,MCP 就从一个简单的工具变成了生产力基础设施。所以,这才是新范式。

它让AI不再局限于“参数规模”或“推理速度”,而是通过数据协同和场景嵌入,成为企业运营的“操作系统”。这才是企业的刚需。

这也是我为啥说,在大模型和 AI 的推动下,自下而上看,未来可能会出现新的飞书、钉钉这样的平台。它们不像飞书、钉钉那样有通讯、协同功能,但至少能把企业的各种业务流程整合起来。

叙事还在继续,到底会不会这样呢?deepseek R2出来后,就见分晓了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
镇江一独栋别墅被推倒欲重建?记者辗转多方核实:该工地无合法手续,目前城管局已介入

镇江一独栋别墅被推倒欲重建?记者辗转多方核实:该工地无合法手续,目前城管局已介入

扬子晚报
2026-01-09 10:48:44
值得珍藏:商业航天+国产算力+机器人+全球第一的企业+6G产业链等

值得珍藏:商业航天+国产算力+机器人+全球第一的企业+6G产业链等

Thurman在昆明
2026-01-08 10:06:36
郑州9岁女孩课堂上写试卷时昏倒去世,家属不忍尸检“她怕疼”,当地成立专班调查

郑州9岁女孩课堂上写试卷时昏倒去世,家属不忍尸检“她怕疼”,当地成立专班调查

大风新闻
2026-01-08 14:41:04
里奇保罗霸气回应詹姆斯交易传闻:手握否决权,湖人敢动他试试?

里奇保罗霸气回应詹姆斯交易传闻:手握否决权,湖人敢动他试试?

夜白侃球
2026-01-08 21:33:33
50岁安吉丽娜·朱莉出售洛杉矶2450万美元豪宅,被曝计划移居,“或为摆脱与前夫布拉德·皮特的纠葛”

50岁安吉丽娜·朱莉出售洛杉矶2450万美元豪宅,被曝计划移居,“或为摆脱与前夫布拉德·皮特的纠葛”

鲁中晨报
2026-01-07 15:57:25
“佛爷迟早卖你” 西蒙尼2次挑衅维尼:6万人前2人互骂 阿隆索气炸

“佛爷迟早卖你” 西蒙尼2次挑衅维尼:6万人前2人互骂 阿隆索气炸

风过乡
2026-01-09 06:15:18
4年5500万!场均轰26+7+7,NBA最失望球队,把重建基石便宜卖掉了

4年5500万!场均轰26+7+7,NBA最失望球队,把重建基石便宜卖掉了

巴叔GO聊体育
2026-01-09 12:09:18
闫学晶好友孙涛再发声:谁要是再敢说闫学晶的坏话,我就跟谁急

闫学晶好友孙涛再发声:谁要是再敢说闫学晶的坏话,我就跟谁急

小徐讲八卦
2026-01-08 09:00:40
带娃上厕所被嫂子网暴后续:宝妈“底裤”被扒,更恶心的还在后面

带娃上厕所被嫂子网暴后续:宝妈“底裤”被扒,更恶心的还在后面

游者走天下
2026-01-07 14:19:47
忍无可忍!篮球专家痛批:直播搬到菜市场,CBA早晚要出事

忍无可忍!篮球专家痛批:直播搬到菜市场,CBA早晚要出事

体育哲人
2026-01-08 12:46:07
0-3!向鹏输球原因曝光,张本智和全程吼叫,赢球庆祝动作太嚣张了!

0-3!向鹏输球原因曝光,张本智和全程吼叫,赢球庆祝动作太嚣张了!

好乒乓
2026-01-09 12:26:43
研究发现他汀类药物与阿尔茨海默病认知能力下降速度减缓相关

研究发现他汀类药物与阿尔茨海默病认知能力下降速度减缓相关

医疗前沿
2026-01-03 01:25:54
韩国人给的太多了!辛纳阿卡空降澳网,一场表演赛各赚200万欧

韩国人给的太多了!辛纳阿卡空降澳网,一场表演赛各赚200万欧

全景体育V
2026-01-09 06:31:56
扬言不上春晚一周后,央媒“点名”岳云鹏,郭德纲的话有人信了

扬言不上春晚一周后,央媒“点名”岳云鹏,郭德纲的话有人信了

好贤观史记
2026-01-09 12:11:06
俄油价暴跌至36美元/桶,川普这盘大棋就是:让你没钱

俄油价暴跌至36美元/桶,川普这盘大棋就是:让你没钱

移光幻影
2026-01-08 17:23:48
很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

很多东西正着不好用,一旦你将它反过来,就会打开新世界大门

新住家居
2025-12-21 18:09:16
0-0!英超争冠3强全刹车:阿森纳领先6分,客场不输曼城=夺冠

0-0!英超争冠3强全刹车:阿森纳领先6分,客场不输曼城=夺冠

体育知多少
2026-01-09 07:17:18
0比3惨案!张本智和遭薛飞横扫,多哈奥运备战拉响警报

0比3惨案!张本智和遭薛飞横扫,多哈奥运备战拉响警报

阿晞体育
2026-01-08 12:44:16
罗德里戈:现在我找到了可以发挥作用的新角色,这样更好

罗德里戈:现在我找到了可以发挥作用的新角色,这样更好

懂球帝
2026-01-09 07:45:44
2026-01-09 13:04:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
128660文章数 861599关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

男子开车撞死1家3口获死缓 14秒速度从0飙至129km/h

头条要闻

男子开车撞死1家3口获死缓 14秒速度从0飙至129km/h

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

檀健次恋爱风波越演越烈 上学经历被扒

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

更智能更豪华 乐道L90加配置会贵多少?

态度原创

艺术
亲子
时尚
手机
军事航空

艺术要闻

Sean Yoro:街头艺术界的“冲浪高手”

亲子要闻

从5楼掉下来被洗衣机接住?腰断了腿骨折了,肚子里还多了一个娃

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

手机要闻

荣耀Magic8 Pro Air定档1月19日:四色可选,至高1TB存储

军事要闻

特朗普:已开始从委石油资源中赚钱

无障碍浏览 进入关怀版