网易首页 > 网易号 > 正文 申请入驻

比现有框架快22倍,浙大开源EasySteer:LLM Steering统一框架

0
分享至



大语言模型 (LLM) 在部署后如何灵活地控制其行为,一直是业界面临的核心挑战。微调代价高昂且存在灾难性遗忘风险,提示工程又只能提供表层的控制,缺乏行为保证。LLM Steering 技术通过在推理阶段对模型隐藏状态进行定向操作,在不修改模型权重的情况下实现精准行为控制,为这一问题提供了一条轻量且可行的路径。

近年来,社区已涌现出 repeng、pyreft、EasyEdit2 等代表性框架,分别在分析式向量提取、学习式表征微调、综合编辑等方向做出了重要探索。不过,随着 Steering 技术从单一实验场景走向多目标、大规模的生产部署,现有框架在推理效率、控制粒度和算法扩展性上仍有进一步提升的空间。

在此背景下,浙江大学研究团队提出了EasySteer——一个基于 vLLM 构建的高性能、可扩展 LLM Steering 统一框架。该框架通过与 vLLM 推理引擎的深度集成,相比现有 Steering 框架实现了 10.8-22.3 倍的推理加速,同时提供更细粒度的干预控制,并为八大应用场景提供了预计算 Steering 向量与完整复现示例,方便研究者快速上手和对照复现。



  • 论文地址:https://arxiv.org/abs/2509.25175
  • 开源代码:https://github.com/ZJU-REAL/EasySteer
  • 演示视频:https://www.youtube.com/watch?v=3rRGzZmhrXg
  • 简易 demo:https://huggingface.co/spaces/zjuxhl/EasySteer

设计动机:从研究原型到生产部署的新需求

随着 Steering 技术在安全控制、推理优化、幻觉缓解等方向不断取得进展,实际应用中对框架提出了更高的要求。研究者总结了三个关键方向:


高吞吐推理:一方面,Steering 研究中大量的评测、消融实验需要反复推理,低效的推理后端会严重拖慢科研迭代速度;另一方面,生产环境通常需要处理大规模并发请求,只有具备足够的吞吐能力,Steering 技术才具备实际部署的可能性。利用 vLLM 等专用推理引擎的连续批处理能力,可以同时在科研效率和生产落地两个层面带来实质性提升。


精细粒度控制:现有框架大多支持层级和位置级别的干预,但在更细粒度的场景下仍有局限。例如,token 级别的条件干预(如仅在特定 token 出现时触发)、多向量协同等能力,对于复杂场景(如推理步边界的选择性干预)至关重要。


便捷的算法集成:Steering 方法迭代迅速,框架需要提供低门槛的插件机制,方便研究者快速实现和对比新算法。



框架设计

EasySteer 由四个模块组成,覆盖从向量生成到应用部署的完整流程:




Steering 向量生成模块:同时支持分析式(CAA、PCA、线性探针、SAE 等)和学习式(LoReFT、LM-Steer 等)两大类方法,通过统一的隐藏状态捕获接口,研究者可以在同一框架内便捷地生成和对比不同类型的 Steering 向量。

Steering 向量应用模块:是 EasySteer 的核心,主要解决三个问题:通过非侵入式的动态模型包装器兼容多种 LLM 架构;通过解耦的算法接口支持自定义 Steering 算法的即插即用;通过精细的参数控制支持条件干预、多向量协同等高级策略。


交互式演示系统:提供基于 Web 的界面,集成推理、多轮对话、向量提取和训练功能,支持基线与 Steering 输出的并排对比。


资源库:提供覆盖安全、推理、知识、真实性、语言、情感、人格、风格八大场景的预计算 Steering 向量,每个场景都附带从数据准备到应用的完整复现流程。



性能评估

框架推理效率

研究者在 NVIDIA A6000 GPU (48GB) 上,使用 DeepSeek-R1-Distill-Qwen-1.5B 进行了系统性基准测试。



在 Steering 开销方面,EasySteer 在全层干预的批量推理场景下,短序列吞吐量为 8991 tokens/s,长序列为 7074 tokens/s,相比无 Steering 基线(10248 / 7563 tokens/s)分别下降约 12% 和 6%。即使同时应用三个 Steering 向量到所有层,长序列吞吐仍保持在 6854 tokens/s,为基线的约 91%。整体来看,Steering 操作带来的额外开销较为可控。

在框架对比方面,以长序列批量推理为例,EasySteer 的吞吐量(7074 tokens/s)约为 pyreft(653 tokens/s)的 10.8 倍、repeng(317 tokens/s)的 22.3 倍。

框架有效性验证


过度思考缓解:研究者参照 SEAL 方法,从 1000 个 MATH 训练样本中提取三种行为向量(执行、反思、转换),在推理步边界处增强执行向量、抑制反思和转换向量。在 DeepSeek-R1-Distill-Qwen-1.5B 上,SEAL Steering 将 GSM8K 准确率从 79.6% 提升至 82.3%,同时 token 使用量减少约 40%。MATH500 上准确率从 70.8% 提升至 78.4%。7B 模型同样展现了效率收益,GSM8K 和 MATH500 分别减少了 13.3% 和 16.8% 的 token 消耗。


幻觉缓解:在 TruthfulQA 数据集上进行两折交叉验证,分析式方法和学习式方法均取得了不同程度的提升。其中,PCA 方法在 Llama-3.1-8B-Instruct 上将多选准确率从 50.55% 提升至 62.67%;LoReFT 在 Qwen2.5-1.5B-Instruct 上将开放式问答准确率从 27.17% 提升至 33.41%。分析式方法在提升准确率的同时通常能较好地保持语言流畅度,学习式方法则在准确率和流畅度之间存在一定的权衡。


定性效果:EasySteer 在八大场景中均展现了有效的行为控制能力。例如,安全场景下可将模型从生成不当内容引导为拒绝回答;推理场景下可将简单算术题的冗长推演简化为直接输出结果;语言场景下可将回复从英文切换为中文输出。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰家属:周六举行追悼会!平时没胸闷、没心脏病,能放心运动吗?医生提醒

张雪峰家属:周六举行追悼会!平时没胸闷、没心脏病,能放心运动吗?医生提醒

上观新闻
2026-03-26 14:45:10
张雪峰的影响力,被严重低估了

张雪峰的影响力,被严重低估了

黔有虎
2026-03-26 14:32:34
4.0 英寸 4050mAh 还有实体键盘!这绝对是今年最酷的新机了

4.0 英寸 4050mAh 还有实体键盘!这绝对是今年最酷的新机了

科技狐
2026-03-25 22:34:58
网友莫斯科遇见58岁伊能静与47岁秦昊,女方脸型紧致比男方还年轻

网友莫斯科遇见58岁伊能静与47岁秦昊,女方脸型紧致比男方还年轻

明星私服穿搭daily
2026-03-21 14:25:06
装钱的麻袋都不够了!俄罗斯每天多挣500亿,四年战争,一朝回血

装钱的麻袋都不够了!俄罗斯每天多挣500亿,四年战争,一朝回血

泠泠说史
2026-03-20 18:31:09
山西太原一学校职工举报自己吃空饷6年,多方回应

山西太原一学校职工举报自己吃空饷6年,多方回应

大风新闻
2026-03-26 15:41:15
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
“重大转变”!外媒:特朗普改变立场,将接受民主党提议重启美国土安全部部分部门

“重大转变”!外媒:特朗普改变立场,将接受民主党提议重启美国土安全部部分部门

环球网资讯
2026-03-25 23:13:02
49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

49岁翁帆突传“喜讯”!丧夫5个月后高调露面,状态好到出人意料

查尔菲的笔记
2026-03-16 19:12:07
中东大战,真正让特朗普害怕的是:中国的已读不回!

中东大战,真正让特朗普害怕的是:中国的已读不回!

阅识
2026-03-26 17:33:54
从欧尔班行为,看北约当年拒绝俄罗斯的远见

从欧尔班行为,看北约当年拒绝俄罗斯的远见

民间胡扯老哥
2026-03-23 18:53:38
放弃阿隆索!利物浦新帅目标敲定,他是下一个克洛普

放弃阿隆索!利物浦新帅目标敲定,他是下一个克洛普

奶盖熊本熊
2026-03-26 04:28:59
加时被逆转!申京:一切发生太快!杜兰特:在胡打,我该果断出手

加时被逆转!申京:一切发生太快!杜兰特:在胡打,我该果断出手

篮球资讯达人
2026-03-26 15:28:40
2大势力联手、布局围剿郑丽文,恐遭灭顶之灾,“内鬼”已经露馅

2大势力联手、布局围剿郑丽文,恐遭灭顶之灾,“内鬼”已经露馅

忠于法纪
2026-03-26 13:28:20
白宫不装了,承认伊朗拒绝谈判,特朗普准备“释放地狱”

白宫不装了,承认伊朗拒绝谈判,特朗普准备“释放地狱”

书纪文谭
2026-03-26 16:28:13
现实中的大龄剩女最后妥协了吗?网友爆笑评论,真是一言难尽。

现实中的大龄剩女最后妥协了吗?网友爆笑评论,真是一言难尽。

侃神评故事
2026-03-25 11:30:09
哪一年退休的人员,享有退休金补发?赶紧看看你符合条件吗?

哪一年退休的人员,享有退休金补发?赶紧看看你符合条件吗?

娱乐洞察点点
2026-03-26 16:11:56
吃相难看!张雪峰去世不到24小时,恶心的事情发生,官方出手整治

吃相难看!张雪峰去世不到24小时,恶心的事情发生,官方出手整治

阿凫爱吐槽
2026-03-25 18:57:39
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
浙江男老师意外发现女学生长相酷似亡妻,鉴定后,结果让他当场愣住

浙江男老师意外发现女学生长相酷似亡妻,鉴定后,结果让他当场愣住

红豆讲堂
2024-09-13 09:35:43
2026-03-26 20:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12607文章数 142594关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
亲子
游戏
公开课
军事航空

艺术要闻

哪一座桥不是风景?

亲子要闻

孩子模仿这种行为,容易被坏人盯上!

10万奖池!2026 KKCS1.6 巅峰之路传奇联赛(春季赛)正式开赛!——KK官方对战平台

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版