网易首页 > 网易号 > 正文 申请入驻

Z Tech|对话Meta FAIR研究科学家:利用Confidence动态过滤,告别低效推理

0
分享至

随着大型语言模型(LLMs)的发展,应用端对其推理效率和性能的要求不断提高,研究人员持续探索更有效的推理方法。因此Deep Think with Confidence(DeepConf)方法应运而生,它克服现有方法的不足,通过利用模型内部置信度信号,在推理过程中或生成后动态过滤低质量推理轨迹,实现推理效率和性能的双重提升

本次访谈,Z Potentials 特邀Meta FAIR研究科学家、加州理工学院博士Jiawei Zhao于北京时间9月9日9:00am直播talk,深度解析其团队颠覆性工作DeepConf,揭开了 LLMs 推理中 “置信度信号驱动低质轨迹动态过滤” 的核心逻辑。Yichao FU和Jiawei Zhao为DeepConf的共同贡献者。



图片来源:
https://jiaweizzhao.github.io/deepconf/


Jiawei Zhao是Meta FAIR(Meta的基础AI研究部门)研究科学家。拥有加州理工学院(Caltech)的博士学位。研究成果主要集中在机器学习领域,特别是针对大型语言模型(LLM)和深度学习的优化方法。

  • 内存优化方面,GaLore(ICML 2024 oral)是Jiawei Zhao在博士期间提出的优化方法,利用梯度的低秩结构显著节省内存和计算资源。Mini-Sequence Transformers是针对长序列训练的中间内存优化方法,相关成果发表于NeurIPS 2024。

  • 推理效率提升方面,Act Only When It Pays 通过selective rollouts引入强化学习方式的高效推理策略,有助于提高模型推理效率;HeadInfer 通过head-wise offloading实现内存高效的LLM推理,进而提升推理效率。

  • 此外还有有关模型微调策略的工作S²FT,发表于NeurIPS 2024。

理论研究方面,Jiawei Zhao有多篇关于低秩梯度/权重结构、张量分解、Quantized GaLore等的论文,覆盖了从理论到实践的广泛方向,为上述内存优化、推理效率提升等方法提供了理论支持。


Yichao Fu是加州大学圣地亚哥分校(UCSD)计算机科学与工程系的博士生,所属Hao AI实验室。聚焦大型语言模型(LLM)推理优化与系统优化,涵盖高效推理机制、系统架构设计、分布式推理等领域,取得了多项研究成果。曾参与开发 “Efficient LLM Scheduling by Learning to Rank”,成果发表于 NeurIPS 2024,聚焦LLM调度效率优化。参与研究 “Break the Sequential Dependency of LLM Inference Using Lookahead Decoding”,发表于ICML 2024,旨在打破LLM推理的顺序依赖限制。

为解决大型语言模型(LLMs)在推理任务中采用自一致性多数投票时存在的准确率收益递减和计算开销过高问题,二位作为共同贡献者提出DeepConf。该方法无需额外模型训练或超参数调优,可无缝集成现有服务框架,核心是利用模型内部置信度信号(如组置信度、底部10%组置信度、尾部置信度)在生成中或生成后动态过滤低质量推理轨迹。分为离线和在线两种模式。



图片来源:
https://jiaweizzhao.github.io/deepconf/

在包括AIME2025在内的多个推理基准测试中,DeepConf均表现优异:离线模式下,DeepConf@512在GPT-OSS-120B模型上实现99.9%准确率,远超传统多数vote的97.0%;在线模式下,相比全并行推理最多减少84.7%生成Token,同时实现准确率的提升,有效平衡推理性能与效率。


预约下方链接!分享会末尾设置QA环节,扫二维码进群获得提问机会

我们正在招募新一期的实习生

我们正在寻找有创造力的00后创业

关于Z Potentials


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一个弱智皇帝会对国家造成怎样的伤害?看看八王之乱就明白了

一个弱智皇帝会对国家造成怎样的伤害?看看八王之乱就明白了

晓张说
2026-01-27 11:10:35
中方:坚决支持古巴,反对调查伊朗

中方:坚决支持古巴,反对调查伊朗

跟着老李看世界
2026-01-28 05:45:04
张雨绮多个商务被取消?NEXXUS、奢思雅:合作已结束

张雨绮多个商务被取消?NEXXUS、奢思雅:合作已结束

南方都市报
2026-01-28 13:02:56
杨瀚森替补6分5板1助攻开拓者不敌奇才,夏普31分失扳平球

杨瀚森替补6分5板1助攻开拓者不敌奇才,夏普31分失扳平球

湖人崛起
2026-01-28 10:27:27
外网热议:葛超峰进入美国ICE仅5天就死亡

外网热议:葛超峰进入美国ICE仅5天就死亡

雪中风车
2026-01-27 18:31:59
从0-1到3-1,法布雷加斯踢疯了!皇马巴萨旧将救主,淘汰佛罗伦萨

从0-1到3-1,法布雷加斯踢疯了!皇马巴萨旧将救主,淘汰佛罗伦萨

万花筒体育球球
2026-01-28 07:39:13
美副防长访韩屡提中国引关注,军事专家:意图借盟友之手为美霸权服务

美副防长访韩屡提中国引关注,军事专家:意图借盟友之手为美霸权服务

环球网资讯
2026-01-28 07:01:07
链上好品牌:山东产业链的“冠军基因”

链上好品牌:山东产业链的“冠军基因”

正解局
2025-08-01 13:13:39
黄仁勋现身深圳吃牛肉火锅,消费800余元

黄仁勋现身深圳吃牛肉火锅,消费800余元

观察者网
2026-01-28 09:50:07
上海机场这两天绷紧了弦?5例尼帕病毒、7天闭环隔离全在动真格

上海机场这两天绷紧了弦?5例尼帕病毒、7天闭环隔离全在动真格

李博世财经
2026-01-27 16:59:22
全是假的!涉及多个品牌,检测结果触目惊心!网友:老人小孩都在吃

全是假的!涉及多个品牌,检测结果触目惊心!网友:老人小孩都在吃

环球网资讯
2026-01-27 15:41:14
卢山,履新上海市领导

卢山,履新上海市领导

极目新闻
2026-01-28 10:05:08
中央另有任用的郭永航,当选新职务!此前任广州市委书记

中央另有任用的郭永航,当选新职务!此前任广州市委书记

上观新闻
2026-01-28 12:59:05
性行为竟能抗癌?华科大研究让人震惊!

性行为竟能抗癌?华科大研究让人震惊!

特约前排观众
2026-01-28 00:20:03
不只是球王,是品牌帝国:库里即将签下史诗级天价合约

不只是球王,是品牌帝国:库里即将签下史诗级天价合约

体育闲话说
2026-01-28 10:00:48
别想歪!这幅人体油画靠“光”就能让你呼吸放缓?答案藏在薄纱里

别想歪!这幅人体油画靠“光”就能让你呼吸放缓?答案藏在薄纱里

陈洪标写字说画
2026-01-27 22:31:02
尼帕病毒来势汹汹,建议:每家最好备6样东西,关键时刻能救命呢

尼帕病毒来势汹汹,建议:每家最好备6样东西,关键时刻能救命呢

现代小青青慕慕
2026-01-28 08:59:53
刚刚!我被重庆“民警”跨省电话传唤

刚刚!我被重庆“民警”跨省电话传唤

宾语观世
2026-01-27 20:58:05
云南“毒红薯”后续:10亿产业崩盘,无辜农户欲哭无泪

云南“毒红薯”后续:10亿产业崩盘,无辜农户欲哭无泪

过了法考的新闻人
2026-01-27 17:19:11
椰树为徐冬冬定制婚宴椰汁,看完包装太上头了

椰树为徐冬冬定制婚宴椰汁,看完包装太上头了

深水财经社
2026-01-27 13:19:05
2026-01-28 13:23:00
ZPotentials
ZPotentials
我们与Z Potentials同频共振
71文章数 1关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

德媒封面:5位欧洲领导人手持武器 配文"唐纳德够了"

头条要闻

德媒封面:5位欧洲领导人手持武器 配文"唐纳德够了"

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

王祖贤入驻某音:一条7秒视频吸粉55万

财经要闻

40倍杠杆断裂!水贝一黄金平台兑付困难

汽车要闻

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

态度原创

艺术
健康
时尚
手机
房产

艺术要闻

震撼!19世纪油画巨匠的作品美得不可思议!

耳石症分类型,症状大不同

被章若楠、舒淇带火的毛衣,这样穿太时髦了!

手机要闻

小米17 Max配徕卡2亿镜头 无背屏Q2季度发布

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

无障碍浏览 进入关怀版