网易首页 > 网易号 > 正文 申请入驻

算力崇拜宣告终结!小模型效率逆袭,AI未来不只看“大”

0
分享至

哈喽,大家好,我是小方,今天,我们主要来看看,曾经被整个科技界奉为圭臬的“大力出奇迹”——即疯狂堆砌算力和参数的AI发展模式,是不是真的走到了尽头。







过去十年,大家似乎形成了一种思维定式:想让AI更聪明?那就加参数、喂数据、砸算力,但这种做法效率越来越低,把学术界挤到了边缘,也让大公司的研究越来越封闭。更重要的是,这条路的回报,正在肉眼可见地递减。





这个团队的策略不是盲目扩大规模,而是采用极高纯度的专业数据集进行训练,并结合了新型的稀疏化训练技术。这个案例就像一记警钟,提醒我们:在计算资源回报递减的时代,优化技术和数据质量,往往比单纯的“更大”更管用。



为什么单纯堆算力不灵了?因为这就像只往一个方向使劲,深度神经网络的学习方式其实很“笨”,它善于记忆常见模式,但对于现实世界中大量存在的、不常见的“长尾”信息,学习效率极低,需要耗费不成比例的巨量算力去“死记硬背”,这就好比为了记住一本词典里所有生僻字,而把整本词典翻来覆去背了成千上万遍。



好在,研究者们找到了其他提升算力“性价比”的杠杆,首先是数据质量。业界现在公认,对数据进行精心清洗、去重、排序,其效果可能远超简单增加数据量。

其次是算法创新。比如,通过“模型蒸馏”技术,让一个庞大的“教师模型”教会一个小巧的“学生模型”,让小模型获得逼近大模型的能力;再比如“检索增强生成”,让模型在回答问题时能实时查阅外部知识库,而不是全靠死记硬背。这些技术,都让等量算力下的产出大幅增加。



最后是架构本身。Transformer架构奠定了过去几年的辉煌,但它可能已触及天花板,新的架构探索,比如更接近生物神经网络的脉冲神经网络,或者能更好处理序列中长期依赖的新模型,正在实验室里萌芽,它们可能从根本上重塑算力与性能的关系曲线。



那么,不迷信算力,路在何方?前沿的探索正在发生几个关键转向。第一个转向,是从“训练算力”到“推理算力”。以前所有智慧都凝结在训练好的静态模型里,现在,人们发现,在模型使用时(推理阶段)投入更多计算资源进行搜索、规划、多步推理,能极大提升最终表现,且成本远低于重新训练,这就像给人一个计算器,而不是让他背下所有乘法表。



第二个转向,是数据从“静态化石”变为“可塑材料”。以前模型在固定数据集上训练完就定型了,现在,借助成本大幅降低的合成数据技术,我们可以主动生成、补充模型薄弱环节所需的数据,让模型在迭代中持续适应新环境。



第三个转向,是智能的核心从“孤立模型”走向“交互系统”。未来的AI能力,可能不单单取决于模型本身,而取决于它如何与工具、数据库、其他AI智能体乃至物理世界进行交互与协同,这要求计算机科学家拥有更广阔的系统思维。



算力是重要的基石,但绝不是唯一的出路。当行业从对算力的盲目崇拜中清醒过来,将目光更多地投向算法革新、数据质量和系统设计时,我们或许才能迎来AI下一个真正稳健、高效且包容的突破阶段,这条路也许没那么“简单粗暴”,但无疑会更可持续,也更能孕育出多样化的智慧。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
孙颖莎迎来绝好消息,王楚钦化身翩翩公子哥,马龙参加米兰时装周

孙颖莎迎来绝好消息,王楚钦化身翩翩公子哥,马龙参加米兰时装周

球盲百小易
2026-01-16 01:09:43
吴敬中死前对余则成说:"在天津找穿蓝旗袍的女人,她知道你身份"

吴敬中死前对余则成说:"在天津找穿蓝旗袍的女人,她知道你身份"

饭小妹说历史
2025-12-16 16:38:39
帮闫学晶撒谎?新疆网2012年发的一篇文章,扯下中戏最后一丝体面

帮闫学晶撒谎?新疆网2012年发的一篇文章,扯下中戏最后一丝体面

八斗小先生
2026-01-14 13:54:37
远华集团老总赖昌星,在狱中对董文华的回忆,让无数人咋舌

远华集团老总赖昌星,在狱中对董文华的回忆,让无数人咋舌

晓艾故事汇
2025-01-09 22:01:49
北京发布超1.4万亿元重点工程项目清单

北京发布超1.4万亿元重点工程项目清单

新华社
2026-01-15 21:54:18
胰腺癌去世的人越来越多!专家:牢记饭后4不做,饭前3不吃

胰腺癌去世的人越来越多!专家:牢记饭后4不做,饭前3不吃

岐黄传人孙大夫
2025-12-20 11:45:03
李珊退出,天津排球主要领导均非排球出身!天津输球陈方有责任

李珊退出,天津排球主要领导均非排球出身!天津输球陈方有责任

金毛爱女排
2026-01-16 00:00:07
人口告别世界第一?二孩催生无效后,国家终于向住房出手了

人口告别世界第一?二孩催生无效后,国家终于向住房出手了

春秋论娱
2025-12-25 07:11:24
全国政协副主席,调研985大学

全国政协副主席,调研985大学

TOP大学来了
2026-01-15 21:39:39
性与命和寿的关系:好命长寿的男人,往往身上有这七种特征

性与命和寿的关系:好命长寿的男人,往往身上有这七种特征

行走的知识库
2025-11-30 11:49:39
检察机关依法分别对刘佳晨、屈振年、李维提起公诉

检察机关依法分别对刘佳晨、屈振年、李维提起公诉

环球网资讯
2026-01-15 16:37:05
78岁退休大爷被儿子送进养老院,捐光378万存款,3个月后儿子大笑

78岁退休大爷被儿子送进养老院,捐光378万存款,3个月后儿子大笑

青青会讲故事
2025-06-26 11:45:03
陪睡陪玩是冰山一角?又一女演员曝内娱潜规则,原来岳云鹏没说谎

陪睡陪玩是冰山一角?又一女演员曝内娱潜规则,原来岳云鹏没说谎

丰谭笔录
2026-01-14 07:05:08
碎三观!重庆一男子和妻妹发生不当关系转账380万,妻子默许了…

碎三观!重庆一男子和妻妹发生不当关系转账380万,妻子默许了…

火山诗话
2026-01-14 09:25:46
浙江多地曝诈骗大案!4种电话别接,一接或亏光积蓄

浙江多地曝诈骗大案!4种电话别接,一接或亏光积蓄

前沿天地
2026-01-15 11:23:08
索尼将退出中国,补偿方案也是值得学习

索尼将退出中国,补偿方案也是值得学习

比尔盖凯
2025-12-18 22:32:52
北京楼市迅雷不及掩耳,西城区待售二手房已由5542套涨至了9236套

北京楼市迅雷不及掩耳,西城区待售二手房已由5542套涨至了9236套

石辰搞笑日常
2026-01-14 02:15:07
孙坚带好朋友袁姗姗西安街头请大家吃烧烤,袁姗姗漂亮又温柔!

孙坚带好朋友袁姗姗西安街头请大家吃烧烤,袁姗姗漂亮又温柔!

动物奇奇怪怪
2026-01-15 14:43:06
-6℃!浙江迎来雨夹雪、雪

-6℃!浙江迎来雨夹雪、雪

台州交通广播
2026-01-15 17:24:37
“坚决反对像Tarriela这样的人,不管他找多少帮手——1个、10个还是100个,中方随时奉陪,而且奉陪到底”

“坚决反对像Tarriela这样的人,不管他找多少帮手——1个、10个还是100个,中方随时奉陪,而且奉陪到底”

新京报政事儿
2026-01-13 11:31:36
2026-01-16 04:32:49
毛豆何时归
毛豆何时归
谢谢关注
208文章数 189关注度
往期回顾 全部

科技要闻

阿里最狠的一次“自我革命”

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

92岁陶玉玲去世,冯远征曹可凡悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

旅游
教育
本地
亲子
公开课

旅游要闻

龙庆峡冰灯节“上新”

教育要闻

网传海淀六小强0.5+3直升计划出炉,6大看点独家解析

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

亲子要闻

爸爸妈妈必备的问题答案——这个世界没有鬼!因为孩子的认知和心理承受力太小了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版