网易首页 > 网易号 > 正文 申请入驻

微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

0
分享至

IT之家 5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。

IT之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系列模型不仅延续了小型模型的高效特性,还在推理能力上实现重大突破。

该系列模型通过推理时间扩展(inference-time scaling)技术,擅长处理需要多步骤分解和内部反思的复杂任务,尤其在数学推理和代理型应用中表现突出,具备媲美大型前沿模型的潜力。

Phi-4-reasoning 是一款拥有 140 亿参数的开源推理模型,通过监督微调(Supervised Fine-Tuning,SFT)Phi-4,结合 OpenAI o3-mini 的高质量推理演示数据,并充分利用额外计算资源,生成详细的推理链条。

Phi-4-reasoning-plus 增强版通过强化学习(Reinforcement Learning,RL)进一步提升性能,tokens 用量比标准版多 1.5 倍,支持更高精度。

两款模型在数学推理和博士级科学问题测试中,均超越 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B,甚至在 AIME 2025(美国数学奥林匹克资格赛)中击败 6710 亿参数的 DeepSeek-R1满血模型。

Phi-4-mini-reasoning 专为计算资源有限的环境设计,是一款基于 Transformer 的紧凑型语言模型,优化用于数学推理。

该模型通过 DeepSeek-R1 生成的合成数据微调,能在低延迟场景下提供高质量的逐步问题解决方案。这款模型覆盖从中学到博士级的百万级多样化数学问题,非常适合教育应用、嵌入式辅导和边缘设备部署。

在多项数学基准测试中,其 3.8 亿参数的表现超越 OpenThinker-7B 和 Llama-3.2-3B-instruct 等更大模型,甚至在部分测试中接近 OpenAI o1-mini 的水平。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中年女人最吃这一套:接吻时男人这样做,她只会更爱你!

中年女人最吃这一套:接吻时男人这样做,她只会更爱你!

枫红染山径
2026-02-09 08:22:50
S妈反悔了!想夺回孙子抚养权准备打官司,小玥儿越来越高冷!

S妈反悔了!想夺回孙子抚养权准备打官司,小玥儿越来越高冷!

古希腊掌管月桂的神
2026-02-06 11:29:24
在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

解读热点事件
2026-02-04 00:05:07
细节满满!外媒:冬奥会资格赛后,谷爱凌介绍起自己的“中国风”雪服

细节满满!外媒:冬奥会资格赛后,谷爱凌介绍起自己的“中国风”雪服

环球网资讯
2026-02-08 16:17:14
人大代表:鸭子是对付福寿螺的高手,但农民告诉我,在上海养鸭子很麻烦,各种部门、各种证、各种规定

人大代表:鸭子是对付福寿螺的高手,但农民告诉我,在上海养鸭子很麻烦,各种部门、各种证、各种规定

新民晚报
2026-02-05 09:09:09
因为长得太漂亮,从护士改行为演员,出道第一部剧就演了女主角

因为长得太漂亮,从护士改行为演员,出道第一部剧就演了女主角

草莓解说体育
2026-02-08 12:21:53
戏剧性拉满的豪门之战!曼城2-1利物浦,这集我们是“真没看过”

戏剧性拉满的豪门之战!曼城2-1利物浦,这集我们是“真没看过”

里芃芃体育
2026-02-09 07:55:44
妻子每周和男闺蜜爬山我从不计较,直到女儿满月宴我甩出亲子鉴定

妻子每周和男闺蜜爬山我从不计较,直到女儿满月宴我甩出亲子鉴定

晓艾故事汇
2026-02-05 17:06:26
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
《太平年》看到水丘公的惨死,才懂,钱弘俶为何将钱弘倧幽禁至死

《太平年》看到水丘公的惨死,才懂,钱弘俶为何将钱弘倧幽禁至死

掠影后有感
2026-02-07 12:17:49
通车倒计时!长沙近年“最贵”断头路即将打通!

通车倒计时!长沙近年“最贵”断头路即将打通!

星耀长沙
2026-02-08 22:55:51
你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

带你感受人间冷暖
2025-11-26 00:10:06
继续跌,今早更冷!年前浙江竟然这么暖,甚至要冲27℃?

继续跌,今早更冷!年前浙江竟然这么暖,甚至要冲27℃?

都市快报橙柿互动
2026-02-09 00:46:51
这就是赤裸裸的现实!未来五年内,央国企劳务派遣或将占90%以上

这就是赤裸裸的现实!未来五年内,央国企劳务派遣或将占90%以上

户外钓鱼哥阿旱
2026-02-06 11:43:41
荒唐!33岁弟媳和58岁老汉偷情,40岁姐姐也要当他情人,结局凄惨

荒唐!33岁弟媳和58岁老汉偷情,40岁姐姐也要当他情人,结局凄惨

谈史论天地
2026-02-08 15:20:04
今天凌晨,谈国新在武汉逝世,官网已变黑白

今天凌晨,谈国新在武汉逝世,官网已变黑白

极目新闻
2026-02-08 14:43:27
登顶越南票房榜首!这只中国小猪妖杀疯了,打工人看完泪崩

登顶越南票房榜首!这只中国小猪妖杀疯了,打工人看完泪崩

陈意小可爱
2026-02-06 11:36:32
原来有了男朋友后免疫系统真的会改变?网友:互换身体优缺点

原来有了男朋友后免疫系统真的会改变?网友:互换身体优缺点

另子维爱读史
2026-02-08 19:47:35
亲戚介绍的相亲对象,
感觉太胖了,
不是喜欢的类型。
好纠结!

亲戚介绍的相亲对象, 感觉太胖了, 不是喜欢的类型。 好纠结!

太急张三疯
2026-02-07 10:40:35
出口突破832万辆,究竟是谁在狂买中国车?

出口突破832万辆,究竟是谁在狂买中国车?

牲产队
2026-02-05 19:16:07
2026-02-09 09:04:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
328817文章数 606980关注度
往期回顾 全部

科技要闻

热血渐凉:被耗尽的小米SU7 Ultra

头条要闻

公司老板表演魔性舞蹈出圈 员工:他平时"玩得比较开"

头条要闻

公司老板表演魔性舞蹈出圈 员工:他平时"玩得比较开"

体育要闻

“我就是王楚钦” 王楚钦霸气指向球衣背后

娱乐要闻

金晨被罚1500后首露面,表情沉重心事重重

财经要闻

文玩假拍骗局调查:3500元瓷瓶估值300万

汽车要闻

VLA司机大模型优化 理想汽车OTA8.3版本更新

态度原创

手机
游戏
时尚
亲子
军事航空

手机要闻

苹果拟于春季发布iPhone 17e 起售价仍为 599 美元

魔兽世界:时光服世界BOSS乱象多,全需党首当其冲,此问题何解?

2026最流行的5种发型,太适合过年了!

亲子要闻

宝宝盯着一桌美食双眼发光,渴望满满

军事要闻

美伊最敏感时刻 林肯号航母迎来三位“不速之客”

无障碍浏览 进入关怀版