网易首页 > 网易号 > 正文 申请入驻

小模型逆袭Deepseek和OpenAI?

0
分享至

大模型可谓日日新,大规模的“重量级选手”到高效的小模型,“轻量化”最近正成为热潮。

传统的大模型就像是“巨人”,体量庞大,推理能力强,但也正因为“庞大”,才带来了“资源”的沉重负担。

最近,低成本AI推理技术崛起,越来越多的小模型横空出世,用其灵活性和高效性,在推理任务中展现出了“巨人”才具备的强大能力。

从“大”到“小”:逆袭大佬

传统的大模型——庞大的计算需求、庞大的存储占用,和与之对应的高昂成本,让其在实际应用中成为了“高岭之花”。如果AI只依赖“大模型”的“坚硬外壳”,我们可能会错失了“轻巧武器”带来的独特优势。

这俩天,普林斯顿大学、北京大学、清华大学等研究员们纷纷大展身手。

通过Test-Time Scaling (TTS)和ReasonFlux框架等技术的突破,让小模型逆袭Deepseek和OpenAI,在数学推理等高难度任务中大放异彩。所以,“细流”的力量也是有可能突破”江河”束缚的。

ReasonFlux:小模型成“快剑”,一刀切复杂问题

如果将AI推理比作一场复杂的棋局,那么ReasonFlux框架就是那根“精妙的棋杆”。

今天,由普林斯顿大学与北京大学联手提出的ReasonFlux框架正式发布并在GitHub开源,通过“分层推理”技术,给AI推理能力装上“快递包裹”轮子,使得小模型可以以更少的计算资源,完成更加复杂的数学任务。

ReasonFlux让小模型“精简高效”,无论面对什么样的难题,都能快速应对,逐步拆解难题。

其提出的分层强化学习,主要是首先从大量的数学问题中提取了约500个结构化的思维模板。每个模板都包含标签、描述、适用范围、应用步骤等信息,

利用这些思维模板,对基础大语言模型(LLM)进行微调,使其深入理解每个模板的结构、内容和用途,微调后的模型会根据输入问题,分析并抽象出核心数学概念,配置出模板轨迹。

通过在类似问题上的求解准确率来衡量轨迹的好坏,再用这个奖励信号优化模型,让它不断改进规划的轨迹。

再通过层次化强化学习训练一个高层次的导航器(navigator),使其能够对输入问题进行拆解,转而求解多个更简单的子问题。

通过这种方式,32B的小模型,在面对AIME等数学基准测试时,直接“挑战”大型模型的霸主地位,轻松超越OpenAI的o1-preview、Deepseek的V3,刷新推理领域的“速度纪录”。

TTS策略:小模型的“计算化身”,超越大模型

另一个帮助小模型突围的技术是Test-Time Scaling (TTS)。

也是在推理时精细分配计算资源的“妙法”。

2月10号由多人多机构联合产出上传的论文“1B参数的大语言模型能否超越405B参数的大语言模型?重新思考计算最优的测试时扩展”震撼AI圈。

TTS策略能够让小模型“量体裁衣”,根据问题的复杂度灵活调节推理所需的计算资源。更像“专将出征”,根据敌情变化灵活调整战术,面对更复杂的敌人,指挥官会“精打细算”调配兵力,而面对简单的敌人,则可以以少胜多。通过TTS策略,1B小模型能够超越405B的大模型,堪比“鲤鱼跳龙门”了……

在这篇论文里,作者通过不同策略模型、PRMs(Policy Response Models)的角度以及更具挑战性的评估任务方面,对计算优化的测试时扩展(compute-optimal test-time scaling, TTS)进行了深入的实证分析。

研究发现,计算优化的TTS策略依赖于策略模型、PRMs和问题难度,验证了在应用计算优化的TTS时,较小的语言模型可能比更大的模型表现更好。

可以说,TTS不仅“解锁”了小模型的潜力,还让它们迎头赶上,超越了那些因庞大计算需求而变得迟缓的大模型。

推理优化:从“大象起舞”到“小巧灵活”

如何让小模型在不增加计算资源的情况下,依然能展现出“大模型”的推理能力呢?

推理优化技术提供了解决方案。小模型的灵活性和高效性,让它能够在“少”中追求“多”,通过精准的推理“步伐”逐步突破难关。

微软亚洲研究院也曾在上个月推出的新算法 rStar-Math,通过引入类似人类系统的慢思考和推理思维,也显著提升了小语言模型(SLMs)的数学推理能力。

这种优化思路通过不断提升推理过程中的“思考”方式,让小模型在面对复杂的推理任务时,展现出“巧妙”优势。

低成本小模型应用的未来不远了

小模型在AI领域的崛起如火如荼地展开。从数学推理到商业应用,低成本小模型不仅能够实现高效推理,还逐渐走向实际应用。低成本的小模型正逐步“走向大众”,突破了大模型“高冷”的局限,使得更多的公司、机构、乃至个人都能享受到这一新技术带来的红利。

可以想象,在不久的将来,随着硬件设施和云计算服务的进一步发展,AI的“门槛”将变得更加低,帮助更多的人迈入智能化时代。从“大型模型”的“庞大身影”,到“小模型”的“高效身手”,AI正在向着更加“灵动”、普惠的未来跃进。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
内娱这波塌房,连粉丝都看不下去了

内娱这波塌房,连粉丝都看不下去了

独立鱼
2026-03-10 21:34:26
内行人建议:把运动服换成它!

内行人建议:把运动服换成它!

超级数学建模
2026-03-10 22:47:18
微信迎来史诗级大更新!全新界面来了

微信迎来史诗级大更新!全新界面来了

XCiOS俱乐部
2026-03-09 20:35:39
刚装上“龙虾”就接到反诈中心电话,“养虾”6小时花掉上千元,别被AI焦虑给钳住了!

刚装上“龙虾”就接到反诈中心电话,“养虾”6小时花掉上千元,别被AI焦虑给钳住了!

极目新闻
2026-03-10 17:02:48
浙江一女子收到老公金镯子,丢地上又响又跳被调侃;金店:假的声音清脆像铁,做专业检测最靠谱

浙江一女子收到老公金镯子,丢地上又响又跳被调侃;金店:假的声音清脆像铁,做专业检测最靠谱

台州交通广播
2026-03-11 17:13:50
28万彩礼被父母扣下,女子10年不回娘家,母亲急了,她却说没退路

28万彩礼被父母扣下,女子10年不回娘家,母亲急了,她却说没退路

大鱼简科
2026-03-09 19:26:08
2名中国女留学生在澳登山不幸遇难!警方:带够防寒衣物却没穿,均死于失温

2名中国女留学生在澳登山不幸遇难!警方:带够防寒衣物却没穿,均死于失温

澳洲红领巾
2026-03-10 13:38:46
1935年,刘文辉一旦炸桥红军绝无可能过河,但他为何只抽了木板?

1935年,刘文辉一旦炸桥红军绝无可能过河,但他为何只抽了木板?

兴趣知识
2026-03-10 18:28:36
难怪特朗普想停战:特朗普之子有了大麻烦,以色列的命根子被炸了

难怪特朗普想停战:特朗普之子有了大麻烦,以色列的命根子被炸了

混沌录
2026-03-11 16:58:08
女子入住洛阳一民宿旁边是古冢,“和古人做邻居,睡得很舒服”,老板:顾客很少有顾虑

女子入住洛阳一民宿旁边是古冢,“和古人做邻居,睡得很舒服”,老板:顾客很少有顾虑

潇湘晨报
2026-03-10 13:05:28
中科院女博导埃及去世后续!死因曝光,学生曝内幕,更多细节流出

中科院女博导埃及去世后续!死因曝光,学生曝内幕,更多细节流出

潮鹿逐梦
2026-03-10 23:22:29
苏州某公务员的征婚信息表,把体制内家庭的优越感写得明明白白!

苏州某公务员的征婚信息表,把体制内家庭的优越感写得明明白白!

黯泉
2026-03-11 20:49:14
第一次,人类「上传」了一个大脑,并让它在虚拟世界活了起来

第一次,人类「上传」了一个大脑,并让它在虚拟世界活了起来

机器之心Pro
2026-03-10 20:10:03
杨毅:阿德巴约得83分,只能说这个时代NBA的数据掺多少水了

杨毅:阿德巴约得83分,只能说这个时代NBA的数据掺多少水了

懂球帝
2026-03-11 18:45:12
张子宇12分中国女篮战胜马里,宫鲁鸣放弃刘禹彤完全正确

张子宇12分中国女篮战胜马里,宫鲁鸣放弃刘禹彤完全正确

李广专业体育评论
2026-03-11 21:06:49
让人眼红啊!江西一副教授晒出2025年收入272340.33元,引发热议

让人眼红啊!江西一副教授晒出2025年收入272340.33元,引发热议

火山詩话
2026-03-11 07:08:03
A股:刚刚,中央一部门发布,释放一信号,周三,将迎来新的变盘

A股:刚刚,中央一部门发布,释放一信号,周三,将迎来新的变盘

云鹏叙事
2026-03-11 00:00:14
一个瞬间崩溃,一个愈挫愈勇,同样是干美国,它和伊朗咋差这么多

一个瞬间崩溃,一个愈挫愈勇,同样是干美国,它和伊朗咋差这么多

未来展望
2026-03-11 23:24:14
焊死在历史上!欧冠10大最难破的神迹:C罗梅西垄断

焊死在历史上!欧冠10大最难破的神迹:C罗梅西垄断

格斗社
2026-03-11 08:00:03
孙怡的肩颈线条优美,行走时体态挺拔,尽显轻盈灵动的姿态

孙怡的肩颈线条优美,行走时体态挺拔,尽显轻盈灵动的姿态

草莓解说体育
2026-03-09 19:47:21
2026-03-12 00:40:49
亿欧
亿欧
更多优质行业资讯请访问亿欧网
131654文章数 95371关注度
往期回顾 全部

科技要闻

腾讯"养虾"暴涨后,百度急得在门口"装虾"

头条要闻

补壹刀:美国不想打了 可能酝酿一个更危险的计划

头条要闻

补壹刀:美国不想打了 可能酝酿一个更危险的计划

体育要闻

郭艾伦重伤,CBA下半赛季还能期待些什么

娱乐要闻

蔡少芬晒全家福照,两女儿成最大亮点

财经要闻

唤醒10万亿存量资金 公积金改革大潮来了

汽车要闻

莲花纠偏, 冯擎峰的“收”与“守”

态度原创

手机
房产
亲子
时尚
家居

手机要闻

第一台龙虾手机来了:小米「养虾」,意在何处?

房产要闻

最低杀到7800元/㎡!海口2026第一波房价大调整来了!

亲子要闻

孕妈体内的血糖容易超标,一般会有这几个信号,各位孕妈们注意了

衣服不用买太多!初春多穿短大衣和针织衫,简单舒适又显高

家居要闻

中式风格 人间朝与暮

无障碍浏览 进入关怀版