网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

小红书Hi Lab团队提出可大幅降低平均思考长度的强化学习训练方式

2025-06-19 20:38:56　来源: 界面新闻

上海举报

0

分享至

6月19日，小红书技术团队发文称，深度思考模型通过Test-Time Scaling（测试时扩展）大幅提升了模型推理能力，但同时也出现了大量冗余和无效思考。小红书Hi Lab团队提出了Think When You Need的强化学习训练方式；在不影响最终效果的前提下，实现动态CoT能力，大幅降低平均思考长度。实验证明，这种思想在推理和非推理等各种任务上广泛适用。团队还发现了一种现象：即在相同任务下，越聪明（参数量大）的模型，需要的思考长度越短；这与当前深度思考模型表现相违背，却十分符合人类的认知。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

媒体：欧洲热浪下中国空调撕开的不只是市场缺口

澎湃新闻 2026-06-30 07:12:58
8831 跟贴 8831
日媒：中国关键金属进口量飙升 "手上有牌"

澎湃新闻 2026-06-29 16:20:35
5082 跟贴 5082

大蒜晒外面被路过女子连盆端走

潇湘晨报 2026-06-30 09:39:11
28 跟贴 28

开了一次就“头晕”？看到机器上的英文单词，他觉得自己被骂了

北青网-北京青年报 2026-06-28 14:48:24
1825 跟贴 1825
当地华人讲述法国高温：中国空调一机难求，有人为抢购空调打起来，安装已排到9月

潇湘晨报 2026-06-29 21:36:19
4725 跟贴 4725

12306账户关联超7个会员账号，女子半年内购票90余次“薅羊毛”

现代快报 2026-06-29 15:31:20
209 跟贴 209

Papi酱名下公司均已注销

鲁中晨报 2026-06-29 14:35:03
815 跟贴 815
“卡牌大师”名不虚传！作为第四官员的马宁，多次提醒主裁向替补席出牌

红星新闻 2026-06-30 08:41:04
349 跟贴 349

河南一农村女孩高考699分，其母亲患病卧床，靠父亲打零工维持生计，她说“要通过学习让父母过上好日子”

极目新闻 2026-06-29 17:19:28
537 跟贴 537
中国县城居民人均收入10强：义乌超过北上广深

第一财经 2026-06-30 07:36:04
51 跟贴 51
运-20最新大片片尾"彩蛋"提到的"小六"是谁专家分析

上观新闻 2026-06-29 14:54:45
450 跟贴 450
刚治完仅4天就“复出”，到底谁在惯着开屏广告？

齐鲁壹点 2026-06-29 17:43:05
308 跟贴 308
藤森庆子，赢得秘鲁总统选举

政知新媒体 2026-06-30 08:53:51
23 跟贴 23
消息称斯塔默有意竞逐下任北约秘书长

界面新闻 2026-06-29 13:13:46
467 跟贴 467
韩红即日起将退出公益行业？韩红基金会回应传闻：目前没有收到任何消息

北京青年报 2026-06-30 13:43:20
541 跟贴 541
赓续光荣传统传承红色基因

人民网 2026-06-30 08:50:18
8 跟贴 8
老人嫌自家小区吵每天清晨到别人小区门口唱歌一周来七天每天唱两小时周末也不休息

闪电新闻 2026-06-30 14:17:41
0 跟贴 0
李雨禅被全网封禁，终于还了网络一片净土

七月生活情感驿站 2026-06-30 14:15:53
0 跟贴 0
改造恐毁小区水景！惠州仲恺半山名苑惠民工程遭业主质疑

南方都市报 2026-06-30 14:12:30
0 跟贴 0
独家｜Kimi估值升至315亿美元 ARR突破3亿美元收入曲线现Anthropic早期特征

财联社 2026-06-30 13:16:04
0 跟贴 0

悲情！7.5亿豪阵为怯懦买单，点球大战3连败，第一罪人非他莫属

悲情！7.5亿豪阵为怯懦买单，点球大战3连败，第一罪人非他莫属

萌兰聊个球

2026-06-30 13:23:30

耻辱！德国前18次世界杯4冠4亚4季17次八强，近三届无缘16强

耻辱！德国前18次世界杯4冠4亚4季17次八强，近三届无缘16强

懂球帝

2026-06-30 07:58:10

被全网骂“坑”的西江千户苗寨，“宰客”传闻是真是假？亲身体验

被全网骂“坑”的西江千户苗寨，“宰客”传闻是真是假？亲身体验

带着瓶盖儿去旅行

2026-06-29 10:21:12

辽篮教头执掌宏远？广东这步棋太险，球迷：真能夺冠

辽篮教头执掌宏远？广东这步棋太险，球迷：真能夺冠

海阔山遥YAO

2026-06-30 13:29:53

“小孩”曾卓君又拿冠军！EVO官方吹爆：第七冠到手

“小孩”曾卓君又拿冠军！EVO官方吹爆：第七冠到手

游民星空

2026-06-29 12:33:21

惠而浦帝国：你家的电器可能都来自同一家公司

惠而浦帝国：你家的电器可能都来自同一家公司

硅屿手记

2026-06-29 01:30:14

76岁内塔尼亚胡已担任以色列总理长达19年，10月将再次竞选，民调显示58%以色列人不希望其连任，以军前总参谋长或扳倒内塔尼亚胡

76岁内塔尼亚胡已担任以色列总理长达19年，10月将再次竞选，民调显示58%以色列人不希望其连任，以军前总参谋长或扳倒内塔尼亚胡

鲁中晨报

2026-06-30 07:50:04

有哪些是你去东北才知道的事情？看网友们的真实分享，惊呆了

有哪些是你去东北才知道的事情？看网友们的真实分享，惊呆了

智慧生活笔记

2026-06-29 15:14:18

新中国第一个被罢免的省长，出狱后下海经商，晚年过得如何？

新中国第一个被罢免的省长，出狱后下海经商，晚年过得如何？

历史图鉴

2026-06-25 22:32:54

尹乃菁辞职后，首次正面回应，矛头直指郑丽文，不简单！

尹乃菁辞职后，首次正面回应，矛头直指郑丽文，不简单！

故事终将光明磊落

2026-06-30 11:02:09

游戏结束，委内瑞拉负债26万亿，还清已无可能，马杜罗在狱中喊话

游戏结束，委内瑞拉负债26万亿，还清已无可能，马杜罗在狱中喊话

触摸史迹

2026-06-30 13:42:38

俄乌局势逆转，俄罗斯犯下严重战略错误！

俄乌局势逆转，俄罗斯犯下严重战略错误！

一个坏土豆

2026-06-28 19:14:03

排成一排向球迷鞠躬！日本球员哭红双眼：非常不甘心，对手太强了

排成一排向球迷鞠躬！日本球员哭红双眼：非常不甘心，对手太强了

风过乡

2026-06-30 04:20:26

温网大冷！首位大满贯冠军出局郑钦文连续4年一轮游王欣瑜晋级

温网大冷！首位大满贯冠军出局郑钦文连续4年一轮游王欣瑜晋级

侃球熊弟

2026-06-30 03:23:53

5-0！葡萄牙造惨案！C罗独中两元！C罗“生死”战创造四大纪录！

5-0！葡萄牙造惨案！C罗独中两元！C罗“生死”战创造四大纪录！

江启

2026-06-30 10:54:18

大冷门！荷兰点球3-4黯然出局：全队沮丧离场，创92年最差成绩

大冷门！荷兰点球3-4黯然出局：全队沮丧离场，创92年最差成绩

体坛小李

2026-06-30 12:54:22

表面老艺术家，私下贪财又好色，这几位晚节不保一点都不冤

表面老艺术家，私下贪财又好色，这几位晚节不保一点都不冤

梦史

2026-06-20 17:12:58

伤口上撒盐！巴西补时绝杀后，库尼亚伸出五根手指嘲讽日本前锋

伤口上撒盐！巴西补时绝杀后，库尼亚伸出五根手指嘲讽日本前锋

刘哥谈体育

2026-06-30 13:11:09

刘尚进任重庆市副市长

新京报

2026-06-30 08:11:13

董卿父亲发文悼念亡妻，句句不提女婿，句句都是对密春雷的寒心

董卿父亲发文悼念亡妻，句句不提女婿，句句都是对密春雷的寒心

潋滟晴方DAY

2026-06-30 13:46:07

只服务于独立思考的人群

1117387文章数 1336511关注度

往期回顾全部

科技要闻

DeepSeek V4正式版要来高峰期API价格翻倍

头条要闻

荷兰队连续3届倒在点球大战此前9次点球大战只赢两场

头条要闻

荷兰队连续3届倒在点球大战此前9次点球大战只赢两场

体育要闻

德国足球，脸都不要了

娱乐要闻

韩红称要退出公益，多位名人挽留

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

汽车要闻

谁懂啊家人们！爹味和班味一点都没，这台底盘最硬国产大猎装太上头！

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手机

家居

教育

本地

公开课

手机要闻

刀法精准苹果iPhone 18e祖传60Hz屏幕接着卖

家居要闻

传奇筑日常诗

教育要闻

找出规律，填写正确的数字

本地新闻

贵州小城的新目标：举办“村超”世界杯！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版