网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

QwenLong-L1.5三招破解大模型长文本推理难题

2026-01-01 18:48:40　来源: 自己撑起一片天

四川举报

0

分享至

这可是大模型应用的核心本事。

先说第一个坎，“虚假繁荣”。

现在测模型找信息，搞个“大海捞针”测试，成绩都挺亮眼。

复杂的“论述题”训练太少，模型自然就不会深度思考。

光定位准还不够，训练过程更是个老大难。

传统RL算法更绝，只要答案错了就狠狠惩罚，模型吓得不敢探索新方法，搞不好训练着就“躺平”了，早早停在半道上。

还有个绕不开的“窗口天花板”。

就算把模型的“阅读窗口”撑到256K、1M个词，碰上一整部代码仓库或者年度财报，照样不够用。

就像看小说只看了几个章节，怎么可能理解整个故事的脉络？

要解决这些问题，QwenLong-L1.5先从“吃”上下功夫。

模型学得好不好，“营养餐”很重要。

他们搞了套多跳推理数据合成流水线，思路挺有意思先把知识点拆成小模块，再像拼乐高似的，按知识图谱或者表格把这些模块重组，生成复杂问题。

就像老师出论述题，先拆解教材里的原子知识点，再设计需要串联多章节内容的题目。

这套“出题引擎”专门生成多跳溯源、全局推理类难题，逼着模型练深度思考。

光有好材料还得会“教”。

QwenLong-L1.5的RL优化策略算是下了功夫。

训练时不再瞎喂数据，而是从多任务类型里均匀抽样本，保证模型每种题型都练到。

奖励信号也分开算，问答任务的奖励不影响计算任务，避免“一荣俱荣，一损俱损”。

最关键的是那个自适应熵控制，模型敢尝试新方法时，就少点惩罚，要是老犯同样的错，再加重惩罚。

这就像教练教运动员，新手多鼓励，老手严要求，训练效果自然稳。

最后是给模型配个“外置大脑”。

他们搞了个记忆管理框架，相当于给模型配了本智能笔记本。

本来想靠扩大窗口硬撑，后来发现搞个“笔记本”才是聪明办法，既省内存又能记住全局信息。

这套组合拳打出来，效果确实挺明显。

我觉得这就像人学会了深度阅读，整体理解能力自然上去了。

这对处理完整代码库、年度财报来说，简直是刚需。

现在团队已经把技术细节和代码开源了，就在GitHub那个仓库里，感兴趣的可以去瞅瞅。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

女子在长沙丢失30万手表，6天后巧遇捡表大叔，表依旧挂在树上！大叔拒收近万元红包

潇湘晨报 2026-01-05 16:26:22
6106 跟贴 6106
峨眉山全山寺院永久免费开放

界面新闻 2026-01-02 10:57:39
10877 跟贴 10877

曼联官方：阿莫林不再担任球队主帅，达伦·弗莱彻将担任代理主教练

极目新闻 2026-01-05 18:26:24
2364 跟贴 2364

突然通知：马上搬离！上海多处魔方公寓停止运营租客报警：电梯停运押金没着落还可能遭“停水停电”

中国能源网 2026-01-05 14:50:11
1544 跟贴 1544
黑龙江三江口景区现3米高“冰封鱼墙”，中华鲟等20余种江鱼成“冰琥珀”，去年这些鱼展后还被竞拍

极目新闻 2026-01-03 14:18:11
864 跟贴 864

女子0.1元打网约车坐上保时捷卡宴，平台：乘客不能指定车型或品牌，偶然碰到高档车是有可能的

极目新闻 2026-01-05 18:45:59
670 跟贴 670

别吃！赶紧扔掉！正大量上市，很多深圳人爱吃

环球网资讯 2026-01-05 14:43:23
209 跟贴 209
8件文玩字画寄存文物商店后失踪，当事人称有画作被拍卖？云南文物总店：库房没有，查找需原始单据

大风新闻 2026-01-05 18:44:41
309 跟贴 309

苏州南京泰州网友纷纷出资打巨幅广告，祝贺永州队“湘超”夺冠，广告公司：广告牌还有很多，足够各地网友打广告

极目新闻 2026-01-05 21:47:19
84 跟贴 84
双色球2026002期中出一等奖12注筹集公益金1.35亿元

齐鲁壹点 2026-01-05 15:00:17
163 跟贴 163
前中国女排队长惠若琪回应跨界做主持人

大象新闻 2026-01-06 08:49:07
286 跟贴 286
邵佳一上任发肺腑之言

大象新闻 2026-01-06 07:01:09
41 跟贴 41
越南第四季度国内生产总值同比增长8.46%

每日经济新闻 2026-01-05 16:03:06
20 跟贴 20
1万多张2元人民币，刚刚拍出83.16万元

都市快报橙柿互动 2026-01-05 13:34:10
310 跟贴 310
格力电器声明

极目新闻 2026-01-05 12:23:30
210 跟贴 210
新生儿剪脐带时疑被助产士剪断手指，两次转院终于接上断指

都市快报橙柿互动 2026-01-05 17:35:36
342 跟贴 342
坚持创新驱动，加紧培育壮大新动能（稳中求进、提质增效实现“十五五”良好开局）

人民网 2026-01-06 06:41:28
67 跟贴 67
快告诉家人！手机这个功能不用时要关闭！

大象新闻 2026-01-06 07:01:09
49 跟贴 49
特斯拉中国：购买Model 3和Model Y、Model Y L车型5年0息

极目新闻 2026-01-06 09:58:24
0 跟贴 0
【压缩包】.zip？

广西交警总队 2026-01-06 12:19:27
0 跟贴 0
3岁男童发烧，医院输液后死亡

蓬勃新闻 2026-01-06 12:19:31
0 跟贴 0

德赫亚：队长袖标对我是种责任，若有人在这不适应可以离开

德赫亚：队长袖标对我是种责任，若有人在这不适应可以离开

懂球帝

2026-01-05 18:02:14

CBA疯狂一夜！广东被3分压哨绝杀，广厦22分惨败，大黑马冲上榜首

CBA疯狂一夜！广东被3分压哨绝杀，广厦22分惨败，大黑马冲上榜首

侃球熊弟

2026-01-05 20:49:34

国产香烟加了助燃剂？测试发现只能烧4分钟，而日本烟能烧7分钟

国产香烟加了助燃剂？测试发现只能烧4分钟，而日本烟能烧7分钟

回旋镖

2026-01-01 21:00:24

藏家朱光回国，南京博物院“重获”《江南春》?

藏家朱光回国，南京博物院“重获”《江南春》?

吃瓜体

2026-01-05 16:15:33

新加坡港吞吐量暴跌，中国50亿工程和海南布局，让其无力回天

新加坡港吞吐量暴跌，中国50亿工程和海南布局，让其无力回天

华山穹剑

2026-01-05 20:38:31

公开道歉，官宣二胎，骤然离世，1月刚开始，娱乐圈又有新“瓜”

公开道歉，官宣二胎，骤然离世，1月刚开始，娱乐圈又有新“瓜”

付老师种植技术团队

2026-01-05 13:14:51

马杜罗其本人首次出庭表现强硬，对旁听说“新年快乐”，其妻太阳穴和额头贴着创可贴；他被指控罪名最低刑期20年，回国可能性微乎其微

马杜罗其本人首次出庭表现强硬，对旁听说“新年快乐”，其妻太阳穴和额头贴着创可贴；他被指控罪名最低刑期20年，回国可能性微乎其微

大象新闻

2026-01-06 11:49:05

哥伦比亚宣布一级战备状态

财联社

2026-01-04 19:40:35

“存储芯片第一股”史诗级IPO！3000亿元长鑫科技来了

“存储芯片第一股”史诗级IPO！3000亿元长鑫科技来了

数据宝

2026-01-06 07:26:52

太原一商场“倒马”雕塑被连夜拆除，只因当地方言解读带侮辱性

太原一商场“倒马”雕塑被连夜拆除，只因当地方言解读带侮辱性

奇思妙想草叶君

2026-01-05 15:57:08

报应来了，马杜罗被抓后，美105座城爆发游行，特朗普或面临弹劾

报应来了，马杜罗被抓后，美105座城爆发游行，特朗普或面临弹劾

博览历史

2026-01-05 13:39:22

不讲逻辑已经成为中国人文社会科学第一大危害和威胁

不讲逻辑已经成为中国人文社会科学第一大危害和威胁

深度报

2026-01-03 22:31:43

外网热议！英国妹子胃痛两年排不上医生，飞中国几天就治完！网友：不信！

外网热议！英国妹子胃痛两年排不上医生，飞中国几天就治完！网友：不信！

英国报姐

2026-01-05 21:41:05

长腿格格帮傻狍子打发炮友

毒舌扒姨太

2026-01-05 22:40:58

被金惠景夫人的女翻译美到啦！翻译小姐姐低头垂眉的样子，真好看

被金惠景夫人的女翻译美到啦！翻译小姐姐低头垂眉的样子，真好看

八八尚语

2026-01-05 16:52:43

宁波队新队徽：由宁波首字缩写NB组成盾牌造型，主色调为蓝色

宁波队新队徽：由宁波首字缩写NB组成盾牌造型，主色调为蓝色

懂球帝

2026-01-06 10:21:07

英超第20轮结束了所有比赛，最新积分榜如下！

英超第20轮结束了所有比赛，最新积分榜如下！

薇说体育

2026-01-06 11:20:17

张水华丈夫将近50岁全马仍能破三，把妻子宠成小公主容忍她的易怒

张水华丈夫将近50岁全马仍能破三，把妻子宠成小公主容忍她的易怒

杨华评论

2026-01-06 02:01:54

乌总统泽连斯基任命加拿大前副总理为经济顾问

乌总统泽连斯基任命加拿大前副总理为经济顾问

每日经济新闻

2026-01-06 07:32:08

1985年梁兴初病逝，妻子收拾遗物后立即致信中央，提出唯一请求

1985年梁兴初病逝，妻子收拾遗物后立即致信中央，提出唯一请求

大运河时空

2026-01-05 10:40:03

自己撑起一片天

热爱生活的小人物

163文章数 97关注度

往期回顾全部

科技要闻

速看！黄仁勋万字实录：甩出"物理AI"王牌

头条要闻

中国留学生在德国遭袭反击致对方受伤警方认定"防卫"

头条要闻

中国留学生在德国遭袭反击致对方受伤警方认定"防卫"

体育要闻

从NBA最菜首发控卫，到NBA最强乔治

娱乐要闻

朱媛媛遗作《小城大事》定档1月10日

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

让智驾能看懂真实世界英伟达发布开源Alpamayo平台

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

家居

房产

本地

公开课

这些新疗法，让化疗不再那么痛苦

家居要闻

引光之宅地下室也有生机

房产要闻

再次登顶海南楼市！超越阿那亚的，只有阿那亚！

本地新闻

云游内蒙｜初见呼和浩特，古今交融的北疆都会

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版