![]()
当大语言模型通过 Test-time Scaling(推理时计算扩展)在逻辑推理上不仅 “读万卷书”,更能 “行万里路” 时,计算机视觉的 “System 2” 时刻也已悄然降临。
从单纯的像素感知,到构建符合物理规律的世界模型(World Models);从平面的模式识别,到复杂的空间推理(Spatial Reasoning)—— 视觉智能正站在新范式的路口。
2026 年 6 月,CVPR 第二届计算机视觉推理扩展研讨会(ViSCALE 2026) 将在美国重磅回归!继首届研讨会成功开启 TTS 在视觉领域的无限可能后,本届 ViSCALE 由来自清华、普林斯顿、UC Santa Cruz、NUS等全球顶尖机构的学者联合举办,将汇聚全球顶尖学者,共同探索如何让视觉模型通过计算扩展突破现有模型的能力瓶颈。
![]()
研讨会亮点:重新定义 “看” 与 “想”
如果说上一代视觉模型是 “直觉反应”,ViSCALE 关注的则是深度推理。我们不再满足于静态的输出,而是探索模型如何在测试时动态分配计算资源,实现从 “看懂画面” 到 “模拟世界” 的跃迁。
我们将重点探讨:
- 世界模型与视频生成: 如何利用 TTS 提升视频生成的物理一致性与长时序因果推理能力?
- 空间与几何推理: 突破 2D 限制,让模型在 3D 空间中具备类似人类的导航与操作直觉。
- 视觉思维链 (Visual CoT): 像 LLM Reasoning 一样,让视觉模型学会 “反思”、“自我修正” 与多步推理。
- 推理扩展律 (Scaling Laws): 探索测试时计算量与视觉推理性能之间的 Scaling Law。
ViSCALE 已经邀请到包括 Sergey Levine, Manling Li, Ziwei Liu 在内的诸多学界和业界顶尖学者,将会围绕空间智能、世界模型等计算机视觉领域新兴的热点话题展开讨论,期待碰撞出新的火花。
论文征稿 (Call for Papers)
我们要寻找的,是能打破现有视觉模型天花板的原创性研究。无论你是深耕理论,还是专注应用,ViSCALE 都是你展示成果的最佳舞台。
核心议题包括但不限于:
- Test-time Scaling 的理论基础与高效算法
- 世界模型、视频生成与复杂决策中的推理扩展
- 具身智能与自动驾驶中的长时序空间推理
- 统一模型中的推理扩展问题
- Visual Chain-of-Thought 与模型可解释性
- 推理扩展带来的安全性、鲁棒性与幻觉问题
研讨会特别鼓励提交新颖观点和创意思路的研究,将会接受多种类型的投稿:
Track 1: 正式论文 (Full Papers)
- 收录类型: Archival
- 篇幅限制: 8 页 (不含参考文献)
- 格式要求: 必须使用 CVPR 2026 Author Kit。
Track 2: 扩展摘要 (Extended Abstracts)
- 收录类型: Non-Archival
- 篇幅限制: 不超过 4 页 (不含参考文献)
- 格式要求: 需使用 CVPR 2026 Author Kit。
重要日期:
- 截止日期: 2026 年 3 月 10 日 (AoE)
- 录用通知: 2026 年 3 月 18 日
- 研讨会时间: 2026 年 6 月 3 日或 4 日(半天,线上线下混合)
Test-time Scaling 作为一项前沿技术,正在为模型推理增强带来革命性的变化。欢迎大家积极参与,踊跃投稿并参与讨论。投稿方式和详细信息参见:https://viscale.github.io/
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.