网易首页 > 网易号 > 正文 申请入驻

“大模型”研究风向变了!从这120篇顶刊顶会看最新研究趋势......

0
分享至

想发大模型论文,却还在“模型规模”上打转?那你跟顶会大概率无缘了!研究风向已经变了, “能力深化与场景适配”才是王道。

具体来说:仔细研究近2年的顶会顶刊能发现,审稿人的口味主要集中在:大模型的技术架构创新、能力边界拓展、多模态融合、效率优化、安全可控等。因此,非常建议想做这领域的伙伴,多多关注前沿的进展。

为方便大家研究的顺利进行,我给大家整理了目前大模型领域最热门的10大方向,共120篇高质量论文,原文和源码都有。主要涉及:原生统一全模态模型、世界模型、VLM、Agent系统、强化学习、潜在推理、高效推理、安全性和可控性……


扫描下方二维码,回复「120LLM

免费获取全部论文合集及项目代码

VLA模型

Spec-VLA: Speculative Decoding for Vision-Language-Action Modelswith Relaxed Acceptance

内容:该研究针对视觉 - 语言 - 动作(VLA)模型因视觉语言模型(VLM)参数量大、自回归解码特性导致的高计算成本问题,首次将投机解码(SD)框架适配并改进提出 Spec-VLA,解决了直接应用 SD 于 VLA 动作预测任务提速效果微弱的痛点。研究基于 VLA 模型动作令牌的相对距离设计了松弛接受机制,有效提升了令牌接受长度,在多个测试场景的实验结果表明,该框架相较 Open VLA 基线模型将接受长度提升 44%,实现了 1.42 倍的推理加速,且完全不损失任务成功率,验证了投机执行在 VLA 动作预测场景的广泛应用潜力,相关代码等研究产物遵循 Apache 协议开源并完成了规范的实验统计与文档说明。


原生统一全模态模型

Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

内容:该论文提出了一款名为 Mobile-O 的紧凑型视觉 - 语言 - 扩散模型,旨在为移动设备提供统一的多模态理解与生成能力。其核心创新包括 Mobile Conditioning Projector(MCP)模块 —— 通过深度可分离卷积和分层对齐实现视觉 - 语言特征的高效融合,以及创新的四元组(生成提示、图像、问题、答案)统一后训练方案,仅需少量训练样本即可同时提升视觉理解与生成性能。Mobile-O 仅含 1.6B 参数,在 GenEval 基准上达到 74% 的成绩,分别超越 Show-O 和 JanusFlow 5% 和 11%,且运行速度快 6-11 倍;在 7 个视觉理解基准上平均性能领先 15.3% 和 5.1%,同时在 iPhone 17 Pro 上实现约 3 秒生成 512×512 图像、内存占用低于 2GB 的实时部署,无需依赖云端,为边缘设备上的实时多模态智能应用奠定了基础,其代码、模型和数据集均已公开。


扫描下方二维码,回复「120LLM

免费获取全部论文合集及项目代码

世界模型

OccTENS: 3D Occupancy World Model via Temporal Next-Scale Prediction

内容:该论文提出了面向自动驾驶的 3D 占用世界模型 OccTENS,针对现有自回归占用模型存在的推理低效、长时生成时序退化和缺乏位姿可控性问题,将占用世界模型重构为时间下一尺度预测(TENS)任务,把时序序列建模拆解为空间逐层生成和时间逐帧预测,设计了 TensFormer 架构实现对占用序列时间因果性和空间关联性的灵活高效建模,并提出整体位姿聚合策略,将车辆自运动与占用信息统一序列建模,同时实现位姿可控的占用生成和自动驾驶运动规划。模型由多尺度场景分词器、运动分词器和生成式世界模型构成,通过解耦帧回归与尺度回归、分离尺度级时间因果注意力和帧级空间注意力,解决了多尺度时序建模的注意力过载问题。在 nuScenes 数据集的实验表明,OccTENS 在 4D 占用预测任务中大幅超越 OccWorld、OccLLaMA 等 SOTA 方法,基于真值占用输入的平均 mIoU 达 22.06%、IoU 达 31.03%,运动规划的长期预测表现更优,且 2 尺度版本推理速度快于 OccWorld,6 尺度版本在性能和效率间实现最优权衡,同时能精准根据给定位姿生成匹配的占用场景,为自动驾驶实时应用提供了高性能、可控制、高效率的 3D 占用世界模型方案。


隐式/潜空间推理

DYNAMICS WITHIN LATENT CHAIN-OF-THOUGHT: AN EMPIRICAL STUDY OF CAUSAL STRUCTURE

内容:该论文针对潜在思维链(Latent CoT)中间计算难以通过关联探针之外的方式评估的问题,提出将其视为表征空间中可操控的因果过程,通过将潜在步骤建模为结构因果模型(SCM)中的变量,并借助逐步干预分析其影响,以探究三个核心问题:哪些步骤对正确性具有因果必要性、答案何时可早期判定;影响如何跨步骤传播及该结构与显式 CoT 的差异;中间轨迹是否保留竞争答案模式及输出层面与表征层面的承诺差异。研究在数学和通用推理任务上对 Coconut 和 CODI 两种代表性范式展开实验,发现潜在步骤预算更偏向具有非局部路由的阶段化功能而非同质化的额外深度,且早期输出偏倚与后期表征承诺之间存在持续差距。该研究构建了首个因果化、步骤解析的潜在 CoT 评估视角,提出算子和读出条件化的影响分析方法,其结果为模式条件化和稳定性感知分析及相关训练 / 解码目标提供了支撑,也为改进潜在推理系统指明方向。


扫描下方二维码,回复「120LLM

免费获取全部论文合集及项目代码

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4.5亿欧元!拉莫斯笑了,将收购塞维利亚,已达成协议只待官宣

4.5亿欧元!拉莫斯笑了,将收购塞维利亚,已达成协议只待官宣

奥拜尔
2026-05-12 19:37:17
不瞒了!马斯克罕见承认:美国是第一,但第二到第十全都来自中国

不瞒了!马斯克罕见承认:美国是第一,但第二到第十全都来自中国

潋滟晴方DAY
2026-04-25 23:29:34
记者:麦基和斯佩尔曼这俩大爷的态度 北京未来很难过上海这一关

记者:麦基和斯佩尔曼这俩大爷的态度 北京未来很难过上海这一关

狼叔评论
2026-05-13 01:50:16
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

社会日日鲜
2026-05-10 09:26:48
腾讯200亿收购喜马拉雅,获批!

腾讯200亿收购喜马拉雅,获批!

达摩财经
2026-05-12 19:27:08
卢琦政祝贺国少出线:带着我们的梦想继续干下去,未完待续

卢琦政祝贺国少出线:带着我们的梦想继续干下去,未完待续

懂球帝
2026-05-13 03:17:15
古巨基庆祝二胎首次过母亲节!57岁妻子产后恢复好,小儿子太像她

古巨基庆祝二胎首次过母亲节!57岁妻子产后恢复好,小儿子太像她

旧时光老师
2026-05-11 20:22:52
樊振东没想到,国乒伦敦夺冠不到24小时,他“处境”变得如此唏嘘

樊振东没想到,国乒伦敦夺冠不到24小时,他“处境”变得如此唏嘘

好贤观史记
2026-05-12 11:03:43
连续2场上演输2追3!梁靖崑被王皓调侃:梁教授这很符合你的专业

连续2场上演输2追3!梁靖崑被王皓调侃:梁教授这很符合你的专业

风过乡
2026-05-12 10:30:02
刘三姐“全裸演出”引争议,张艺谋惹怒全网

刘三姐“全裸演出”引争议,张艺谋惹怒全网

营销头版
2026-05-10 20:09:26
苹果正式宣布,这项重要功能终于开放!

苹果正式宣布,这项重要功能终于开放!

XCiOS俱乐部
2026-05-12 10:13:11
不是周琦&赵睿,广东主帅赛后盛赞北京一人,他击垮我们所有努力

不是周琦&赵睿,广东主帅赛后盛赞北京一人,他击垮我们所有努力

慢歌轻步谣
2026-05-13 01:03:07
亚历山大:毫不夸张地说 米切尔是这轮系列赛表现最出色的球员

亚历山大:毫不夸张地说 米切尔是这轮系列赛表现最出色的球员

北青网-北京青年报
2026-05-12 20:22:04
农村光棍没减少,又冒4个扎心怪象,热闹背后全是难念的经

农村光棍没减少,又冒4个扎心怪象,热闹背后全是难念的经

老特有话说
2026-05-12 15:30:33
日本大型电机制造企业尼得科公司被曝大规模造假

日本大型电机制造企业尼得科公司被曝大规模造假

澎湃新闻
2026-05-12 21:33:09
上海一医院300斤“重磅”医生火出圈!“过劳肥算工伤”具象化了!

上海一医院300斤“重磅”医生火出圈!“过劳肥算工伤”具象化了!

新民晚报
2026-05-12 18:07:01
炸锅!阿森纳 1 亿目标遭截胡!恩里克钦点,大巴黎已反超领跑

炸锅!阿森纳 1 亿目标遭截胡!恩里克钦点,大巴黎已反超领跑

澜归序
2026-05-13 05:51:56
史无前例!日本拟正式定调:中国是“威胁”,安保政策彻底变天!

史无前例!日本拟正式定调:中国是“威胁”,安保政策彻底变天!

人间无味啊
2026-05-11 19:25:52
快速入睡无成瘾!又一国产安眠新药即将落地,3亿失眠人有解了?

快速入睡无成瘾!又一国产安眠新药即将落地,3亿失眠人有解了?

思思夜话
2026-05-12 16:51:58
2026-05-13 06:32:49
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3395文章数 11150关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

旅游
亲子
手机
数码
军事航空

旅游要闻

故宫挤满游客,人人撑伞前行:宁愿热到出汗,也要奔赴紫禁城!

亲子要闻

夏天建议:把孩子的空调服换成它!

手机要闻

10年支持不变:谷歌力保现有Chromebook

数码要闻

看电视的人越来越多了 3亿台电视在线 小米第一

军事要闻

知情人士披露:美国或考虑恢复对伊朗军事行动

无障碍浏览 进入关怀版