网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

阿里通义实验室智能计算团队推出新算法FIPO

2026-04-07 22:32:42　来源: 界面新闻

上海举报

0

分享至

4月7日，阿里通义实验室智能计算团队宣布推出新算法FIPO（Future-KL Influenced Policy Optimization），引入Future-KL机制，奖励关键Token，解决纯强化学习（Pure RL）训练中“推理长度停滞”难题。据该团队介绍，在32B规模的纯RL设定下，率先实现对o1-mini与同规模DeepSeek-Zero-MATH的性能反超。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

2026年，大模型训练的下半场属于「强化学习云」

机器之心Pro 2026-01-12 14:03:47
0 跟贴 0
神秘新王“欢乐马”，原来是阿里ATH大模型新副本首秀

智东西 2026-04-11 00:17:44
2 跟贴 2

让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

量子位 2026-04-06 13:33:32
0 跟贴 0

AGILE：自监督+交互式强化学习助力VLMs感知与推理全面提升

机器之心Pro 2025-10-20 18:30:03
0 跟贴 0
阿里内测大模型屠榜，被称最强视频生成模型

每日经济新闻 2026-04-11 01:31:48
0 跟贴 0

重构跨域RL框架！理论驱动「双重对齐」让跨域迁移「质变」

机器之心Pro 2026-04-02 14:58:04
0 跟贴 0

Meta亿元天团首个大模型交卷！耗时九个月，一雪Llama前耻

量子位 2026-04-09 09:48:05
9 跟贴 9
滴滴自动驾驶张博：深耕AI、硬件、场景三大能力，持续强化创新突破

钛媒体APP 2026-04-11 17:55:08
0 跟贴 0

押注B.AI，AI Agent时代的底层能力竞赛开始了

每日经济新闻 2026-04-11 18:41:15
0 跟贴 0
反应提升20%、强化学习升级，特斯拉FSD最新版本实测～

Cyber维克托 2026-04-09 21:09:11
18 跟贴 18
阿里不止一匹“快乐马”

钛媒体APP 2026-04-11 10:20:11
3 跟贴 3
警惕！日本某些势力“定制”AI反华视频，用算法“加持”仇恨（来源：钧正平）

学申论的谈妹 2026-04-11 03:22:48
0 跟贴 0
VinciCoder：多模态统一代码生成框架和视觉反馈强化学习

机器之心Pro 2025-11-17 14:12:38
0 跟贴 0
马斯克用Grok替代X员工，裁员90%

量子位 2025-11-29 16:58:47
26 跟贴 26
外国男子用手机做计算，每个数字都让人刻骨铭心，网友：打工人才看得懂的操作

星沙时报 2026-04-09 17:32:56
0 跟贴 0
创行业纪录！30多家车企使用阿里平头哥自研PPU：部署突破10万卡

快科技 2026-04-11 12:39:07
0 跟贴 0
HappyHorse目前正处于内测中，将于近期开放API

每日经济新闻 2026-04-11 01:31:48
0 跟贴 0
以色列袭击黎巴嫩被谴责，内塔尼亚胡：“以军是世界上最有道德的军队”；此前以色列对黎巴嫩发动袭击，造成包括儿童在内数百名平民死伤

扬子晚报 2026-04-11 11:33:21
43363 跟贴 43363
挑战Seedance！阿里新模型低调上线，登顶AI视频测评榜

极果酷玩 2026-04-09 17:06:04
0 跟贴 0
汉族的保底机制

杨轶 2026-04-09 21:45:18
0 跟贴 0
小升初奥数思维培优专题找规律的复杂计算，先观察在分组进行

唐老师小课堂 2026-04-09 13:02:13
1 跟贴 1
木头边角对接计算

每日看点汇 2026-04-10 12:53:42
0 跟贴 0
这个挥金如土的阔太，才是马云真正的靠山

雷科技 2025-11-12 16:35:27
0 跟贴 0
马云的奇幻漂流：断臂2023（中）

饭统戴老板 2025-10-17 10:36:14
0 跟贴 0
围棋黑先巧妙破眼，精准计算绝杀棋局

晨光如昨v 2026-04-09 00:16:05
0 跟贴 0
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
法律的特殊功能——它不替你做判断，而是消除信息差

周兆成律师 2026-04-11 17:33:15
0 跟贴 0
函数空间作为向量空间 | 泛函分析第二讲

集智俱乐部 2026-04-11 14:34:33
0 跟贴 0
美国大姐怒骂政客，美版算法稀烂，都想换回中国算法

搞笑小哈皮 2026-04-10 00:00:00
0 跟贴 0
计算木料挎着的角度

奇观趣闻 2026-04-10 12:15:08
0 跟贴 0
仍有地方弄虚作假！督察组进驻后，发现了不少问题

政知新媒体 2026-04-11 06:19:51
289 跟贴 289
091初中数学速算题，计算两个四位数和的平方

我服子佩 2026-04-09 13:43:59
1 跟贴 1
16家上榜！常州首批米其林餐厅揭晓

现代快报 2026-04-09 20:19:03
260 跟贴 260
充电按功率收服务费，充电算法引业主质疑

民生大参考 2026-04-11 02:16:05
0 跟贴 0
美载人绕月飞船溅落在预定海域

新华社 2026-04-11 08:11:58
541 跟贴 541
通往佛山莫氏鸡煲店的道路即将完工，预计下周可通行，老莫：我想缩小店面

极目新闻 2026-04-11 15:20:15
37 跟贴 37
河南一宝妈听信“积食要少吃”，连续一个月把奶冲稀、减量，把9斤的宝宝饿瘦到7斤，误以为脾胃不好就医

大象新闻 2026-04-10 22:44:06
229 跟贴 229
新华社千笔楼：切莫再出“陪葬大奔”的荒诞闹剧

澎湃新闻 2026-04-11 19:52:07
1 跟贴 1
生成式推理再排序，可能会是LLM4RecSys的新突破口吗？

机器之心Pro 2026-04-08 11:52:53
0 跟贴 0
Mini发布全新Red Line Edition，四门精装，价格比双门版JCW更贵 | 酷乐汽车

CLauto酷乐汽车 2026-04-09 23:35:41
0 跟贴 0

不是克洛普！皇马新帅锁定世界冠军教头，阿韦洛亚悬了！

不是克洛普！皇马新帅锁定世界冠军教头，阿韦洛亚悬了！

澜归序

2026-04-11 05:19:28

文章新饭店开张！开业当天人气爆满，文章戴婚戒抱着婴儿在店合影

文章新饭店开张！开业当天人气爆满，文章戴婚戒抱着婴儿在店合影

一盅情怀

2026-04-10 15:38:43

全红婵风波大结局！事件涉多位运动员，一人已被抓，处罚结果曝光

全红婵风波大结局！事件涉多位运动员，一人已被抓，处罚结果曝光

自己选择的路

2026-04-11 19:41:30

太突然！风向变了，很多人开始抨击全红婵，又印证了谷爱凌的话！

太突然！风向变了，很多人开始抨击全红婵，又印证了谷爱凌的话！

以茶带书

2026-04-04 15:06:37

CCTV5直播广厦VS广东，杜锋收获好消息，胡明轩转型，王博再补强

CCTV5直播广厦VS广东，杜锋收获好消息，胡明轩转型，王博再补强

体育大学僧

2026-04-11 09:48:13

防不胜防，3万股东突发踩雷，业绩盈转亏，可能被实施st退市警示

防不胜防，3万股东突发踩雷，业绩盈转亏，可能被实施st退市警示

丁丁鲤史纪

2026-04-11 10:51:17

中国已无需武统？美专家：美军白忙一场，解放军已有不战而胜之法

中国已无需武统？美专家：美军白忙一场，解放军已有不战而胜之法

有牙的兔纸

2026-02-25 00:44:28

女护士夜班照顾植物人,半年后被发现有身孕,领导看监控:丧尽天良

女护士夜班照顾植物人,半年后被发现有身孕,领导看监控:丧尽天良

流萤叙情

2025-08-05 18:53:56

孙杨：与张豆豆已有孩子

南方都市报

2026-04-09 19:55:35

被传离婚6年后，董卿婚姻真相大白，如今隐居上海，低调陪父母

被传离婚6年后，董卿婚姻真相大白，如今隐居上海，低调陪父母

往史过眼云烟

2026-04-11 15:01:23

吉林财大食堂“发疯120秒”视频流出：新型巨婴，别出来害人了

吉林财大食堂“发疯120秒”视频流出：新型巨婴，别出来害人了

小椰子专栏

2026-04-08 13:03:26

伊朗代表团强调解冻资产及实现黎巴嫩“真正停火”

伊朗代表团强调解冻资产及实现黎巴嫩“真正停火”

澎湃新闻

2026-04-11 19:52:09

全红婵网暴事件升级，网暴群群主身份曝光，身后留下3大疑问

全红婵网暴事件升级，网暴群群主身份曝光，身后留下3大疑问

悦君兮君不知

2026-04-11 16:05:17

天津市副市长张玲任天津市委常委

天津市副市长张玲任天津市委常委

澎湃新闻

2026-04-11 15:26:29

为啥男人一出门就要拉屎?

混知

2026-04-09 14:55:16

霍思燕带狗泰国夺冠！肥肚三层、发际线好假，女儿出镜像女版杜江

霍思燕带狗泰国夺冠！肥肚三层、发际线好假，女儿出镜像女版杜江

翰飞观事

2026-04-08 19:57:12

申花VS海港首发：4外援PK！张琳芃卢永涛登场汪海健+高天意先发

申花VS海港首发：4外援PK！张琳芃卢永涛登场汪海健+高天意先发

我爱英超

2026-04-11 18:25:06

国乒最新动态：4月11日冲击首金，国际乒联闹笑话，樊振东现身

国乒最新动态：4月11日冲击首金，国际乒联闹笑话，樊振东现身

格斗一点通

2026-04-11 11:35:41

【特稿】承诺多兑现少　“和平委员会”被曝囊中羞涩

【特稿】承诺多兑现少　“和平委员会”被曝囊中羞涩

新华社

2026-04-11 15:48:19

越来越多的人开始靠网贷、借贷过活了！

越来越多的人开始靠网贷、借贷过活了！

黯泉

2026-04-11 15:05:22

只服务于独立思考的人群

1054435文章数 1332772关注度

往期回顾全部

科技要闻

半夜被燃烧瓶砸醒，OpenAI CEO发文反思

头条要闻

美国否认同意解冻伊朗资产巴官员:美方急了伊朗不急

头条要闻

美国否认同意解冻伊朗资产巴官员:美方急了伊朗不急

体育要闻

换帅之后，他们从降级区冲到升级区

娱乐要闻

浪姐7淘汰该走的没走，不该走的走了

财经要闻

从日本翻身看：这次谁能扛住高油价？

汽车要闻

焕新极氪007/007GT上市限时19.39万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

手机

本地

公开课

军事航空

《星砂岛》小游戏侵权俄罗斯方块已从Steam下架

手机要闻

华为Pura X Max设计图！阔折形态+麒麟9030，你的钱包顶得住吗

本地新闻

12吨巧克力有难，全网化身超级侦探添乱

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

伊朗议长带四名遇难儿童照片赴美伊谈判

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版