网易首页 > 网易号 > 正文 申请入驻

HF日趋榜一!真端到端模型AutoDeco终结手动调参解码

0
分享至



大语言模型(LLM)的「炼丹师」们,或许都曾面临一个共同的困扰:为不同任务、不同模型手动调整解码超参数(如 temperature 和 top-p)。这个过程不仅耗时耗力,而且一旦模型或任务发生变化,历史经验便瞬间失效,一切又得从头再来。

这种繁琐的试错过程,在许多研发团队的日常沟通中屡见不鲜,正如下图所展示的那样:



图 1:研发人员手动调整解码参数的日常。

一个灵魂拷问随之而来:为何不能让模型自己学会如何解码,从而实现真正的「端到端」?

事实上,各大模型厂商的 API 文档也印证了这一难题。以 DeepSeek 为例,其官方文档明确建议针对不同场景设置截然不同的 temperature 值,这使得单一的静态参数设置显得捉襟见肘。



图 2:不同任务需要不同的解码参数,这使得静态设置难以应对复杂多变的现实需求。

近日,由腾讯 AI Lab 的王琰研究员及其团队领衔,联合香港中文大学(深圳)唐晓莹教授及其博士生王志超给出了一个优雅的答案。他们推出了名为 AutoDeco 的全新架构,旨在彻底终结手动解码的「手工作坊」时代。这项研究《The End of Manual Decoding: Towards Truly End-to-End Language Models》,通过让模型动态预测并控制自身的解码参数,向着真正端到端的语言生成迈出了关键一步。



  • 论文链接: https://huggingface.co/papers/2510.26697
  • 代码链接: https://github.com/Zacks917/AutoDeco
  • 模型链接: https://huggingface.co/collections/Jadeislaw/autodeco



图 3:AutoDeco 位居 Hugging Face Daily Papers 榜首

当前,尽管 LLM 本身已高度集成,但其生成过程的「最后一公里」—— 解码,仍然是一个独立于模型之外的、不可微的僵硬环节。研究团队形象地将其比作「手动挡变速箱」:无论引擎(LLM)多么强大,换挡(调参)依然依赖人工操作。

AutoDeco 的核心思想,就是为 LLM 装上「自动挡」。它通过在标准 Transformer 架构中引入两个超轻量的预测头,让模型在生成每一个 token 时,都能根据当前的上下文信息,动态地预测出最适合下一步生成的 temperature 和 top-p 值。其架构如下图所示:



图 4:AutoDeco(上)与传统手动解码(下)的对比。AutoDeco 将解码参数的预测无缝集成到模型的前向传播中,实现了动态自调节。

核心挑战与技术突破:如何训练一个没有「标准答案」的任务?

设想很美好,然而,一个关键的挑战摆在研究团队面前:如何训练这些预测头?在训练数据中,并不存在每一时刻「正确」的温度和 top-p 标签,这使得监督学习无从谈起。

为此,团队提出了一种创新的、完全端到端的训练策略。他们设计了一种新颖的可微分「软性 top-p」(soft top-p)机制,巧妙地替代了传统 top-p 采样中不可微的「硬截断」操作。该方法分为三步:





图 5:可微分的 soft top-p(橙色线)与传统的 hard top-p (绿色线)对比。Soft top-p 的平滑特性打通了从最终损失到解码参数预测头的梯度路径。

这一设计的巧妙之处在于,它使得从最终的「下一个词预测」损失到解码参数预测头的梯度能够顺畅回传。如此一来,模型便可以在标准的 Next Token Prediction 任务中,通过优化最终生成结果来「倒逼」自己学会如何动态调整解码策略,整个过程无需任何额外的标注数据。

AutoDeco 的惊人表现:三大亮点

通过在 Llama、Qwen、Deepseek 等多个主流模型家族上的广泛实验,AutoDeco 展现了其强大的能力:

  • 卓越的性能与泛化能力

实验结果表明,AutoDeco 不仅稳定超越了传统的 Greedy Search 和 Default Sampling 等基线方法,其性能甚至能媲美、乃至超越了利用测试集进行精细调优的「神谕」基线(oracle-tuned baseline)。





图 6:AutoDeco 在多个数学和通用任务 benchmark 上均取得了 SOTA 性能,展现了其强大的泛化能力。

  • 极致的效率与易用性

AutoDeco 的预测头设计极为轻量,其带来的额外推理延迟通常仅为 1.7%,内存开销也几乎可以忽略不计。对于开发者而言,接入 AutoDeco 模型仅需修改几行代码,即可享受「免费」的性能提升。

  • 「言出法随」:开创性的自然语言控制能力

研究中最令人兴奋的发现之一,是 AutoDeco 涌现出的一种「通过自然语言控制解码」的能力。用户可以直接在 prompt 中通过自然语言下达指令,如「我希望答案更有创意」,模型便能「听懂」并自主地调高其预测的 temperature 和 top-p 值,整个过程清晰可见。



图 7:在不同指令下,AutoDeco 预测的 T/P 值变化。从左至右分别为:基线、高创造力指令(T/P 值自发升高)、高确定性指令(T/P 值自发降低)。

当然,作者坦言这种能力还不够完善,还做不到非常精准的控制。他们猜测实现细粒度、高精度的自然语言控制解码无法仅仅能通过微调 AutoDeco 模块做到,而是需要全参微调模型,这也被他们列为了 Future work 的重点。因此,作者没有放出带有自然语言控制能力的 AutoDeco heads 权重。

AutoDeco 在发布后迅速吸引全球 AI 社区的关注,在 Twitter 等社交平台上引发了顶尖学者、开发者和企业家的广泛热议和高度评价。



图 8:大模型社区对 AutoDeco 的广泛热议和高度评价。

目前,该团队已将论文、代码以及在多个主流模型上训练好的 AutoDeco heads 全面开源,包含适配于 Deepseek V3.1、Qwen3-235B、GPT-OSS-120B 等生产级大模型的版本。正如研究人员在分享中所说,这项工作旨在将研究者和开发者从繁琐的调参工作中解放出来,共同迈向一个更智能、更自动化的 AGI 新时代。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
埃弗顿2-1逆转富勒姆,霍尔建功,米科连科、莱诺乌龙

埃弗顿2-1逆转富勒姆,霍尔建功,米科连科、莱诺乌龙

懂球帝
2026-02-08 01:05:56
《太平年》和真实历史差距大?孙太真人设直接拧成麻花!

《太平年》和真实历史差距大?孙太真人设直接拧成麻花!

专揪川普那只好耳
2026-02-07 14:30:44
“胖成了35岁大叔” 苏翊鸣回应被教练称飘了:好空虚 休息了1年半

“胖成了35岁大叔” 苏翊鸣回应被教练称飘了:好空虚 休息了1年半

风过乡
2026-02-07 16:27:01
利马此役精准传球103次,本赛季队内英超单场传球次数最多

利马此役精准传球103次,本赛季队内英超单场传球次数最多

懂球帝
2026-02-07 23:50:39
当年为什么查办褚时健?

当年为什么查办褚时健?

蜉蝣说
2026-02-03 14:47:37
霍去病二十四岁病逝,武帝哭三日,第四日却杀尽其十七名贴身侍卫

霍去病二十四岁病逝,武帝哭三日,第四日却杀尽其十七名贴身侍卫

掠影后有感
2025-12-25 12:38:58
让普京措不及防,一台机器人灭一整队俄军,乌军地雷新战法

让普京措不及防,一台机器人灭一整队俄军,乌军地雷新战法

说宇宙
2026-02-06 14:46:27
微博之夜第一排:比C位还靠前、和资方同起同坐的她,到底凭啥?

微博之夜第一排:比C位还靠前、和资方同起同坐的她,到底凭啥?

暖心萌阿菇凉
2026-02-06 18:20:22
中国抗美援朝时,头脑最为清醒的美国高层就是美国防长马歇尔了

中国抗美援朝时,头脑最为清醒的美国高层就是美国防长马歇尔了

安安说
2026-02-06 12:07:55
别再买错了!网购时“旗舰店”和“官方店”差2字,背后差别不小

别再买错了!网购时“旗舰店”和“官方店”差2字,背后差别不小

复转这些年
2026-01-20 08:10:05
0-3到2-0!U16神奇逆转,国足四线告捷,冲世少赛有戏了

0-3到2-0!U16神奇逆转,国足四线告捷,冲世少赛有戏了

林子说事
2026-02-07 10:55:40
冬奥会正式开幕:中国红闪耀米兰,郎朗时隔18年再登奥运舞台

冬奥会正式开幕:中国红闪耀米兰,郎朗时隔18年再登奥运舞台

封面新闻
2026-02-07 10:59:03
2月7日俄乌:美施压乌尽快公投并大选,特朗普时间不多了

2月7日俄乌:美施压乌尽快公投并大选,特朗普时间不多了

山河路口
2026-02-07 18:05:12
俄方警告日本“再军事化”,日本会成第二个乌克兰吗?

俄方警告日本“再军事化”,日本会成第二个乌克兰吗?

毛开云
2026-02-03 10:43:17
海航HU492航班风挡破裂紧急返航,全机人员平安

海航HU492航班风挡破裂紧急返航,全机人员平安

界面新闻
2026-02-07 12:43:05
“换手率”是A股唯一不骗人的指标,一旦大于20%就是主力叫你进场

“换手率”是A股唯一不骗人的指标,一旦大于20%就是主力叫你进场

股经纵横谈
2025-11-01 21:02:39
WC!封神了!绿军牛逼大交易...

WC!封神了!绿军牛逼大交易...

技巧君侃球
2026-02-07 22:39:31
某高校博导、特聘研究员被联合举报的大瓜

某高校博导、特聘研究员被联合举报的大瓜

穿透
2026-02-07 23:29:01
都想击沉中国军舰?美西方集体许愿,解放军回应一针见血:想得美

都想击沉中国军舰?美西方集体许愿,解放军回应一针见血:想得美

东方点兵
2026-02-07 16:33:37
白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

离离言几许
2026-02-06 22:01:56
2026-02-08 01:36:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12265文章数 142564关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

印度飞饼师傅被认定"外籍专家"领千元慰问费 多方发声

头条要闻

印度飞饼师傅被认定"外籍专家"领千元慰问费 多方发声

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

本地
健康
旅游
教育
公开课

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

转头就晕的耳石症,能开车上班吗?

旅游要闻

“甜”度拉满!金湾区70项活动点亮农文商旅融合年味

教育要闻

大学生寒假归来,家长崩溃:儿子变成闺女了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版