网易首页 > 网易号 > 正文 申请入驻

对话上交大程远:AI的终局不在云端,而在“感算一体”的物理世界

0
分享至



如今,在关于 AI 的讨论中,大模型仍然占据着最突出的位置。但在它之外,另一条更贴近现实世界的方向正在悄然加速:端侧 AI。

所谓端侧AI,是指将算法和模型直接部署在机器人、智能汽车、消费电子、智能制造等终端设备上,使设备能够在本地完成数据采集、分析、推理和决策,而无需依赖云端服务器持续联网传输数据的技术模式。

以具身机器人为例,如果其动作决策完全依赖云端计算,网络波动可能导致抓取、避障或交互动作延迟,影响操作安全和自然性;而搭载端侧 AI,它就能在本地毫秒级完成手势识别、物体抓取或行人避让,不仅降低功耗,还能确保交互过程中敏感视频或传感数据不外传,提升隐私与安全性。

从云端到端侧,不仅是算力位置的迁移,更需要对整体架构进行重写。传统设备长期遵循“先采集、后传输、再计算”的串行逻辑,传感器与处理器各自为政,数据搬运会消耗大量时间与能量。而端侧 AI 则需要做到“感算一体”:让感知与计算在物理层面深度融合,实现“感知即计算”。

在这方面,上海交通大学人工智能学院副教授程远的研究方向颇具代表性。从清华大学的前沿交叉,到上海交通大学的系统研究,再到横跨学术界与产业界的多段经历,他始终聚焦一个问题:如何让智能真正“落地”?

在采访中,程远对于每一个问题的解答几乎都是以“系统性工程”的角度去看待。无论是探索突破传统存算瓶颈的光子计算,还是重构端侧硬件架构,他认为,AI 的规模化落地并非依赖算法单点突破,而是算力底座、物理器件与软硬件协同设计的同步演进。

这种思路,也体现在他的创业实践中。2019 年,程远还在上交大读博期间作为创始人成立了辛米尔科技,现担任首席科学家。作为一家端侧 AI 公司,辛米尔试图打破传统冯·诺依曼架构的边界,将感知、计算与行动深度融合。在他们看来,AI 的下半场需要的不是更大的模型,而是更高效、更实时、能够嵌入物理设备的硬件原生智能系统。

而这种硬件原生的端侧能力,也是 Agentic AI 从“对话”走向“行动”的关键。当设备具备本地实时感知与自主决策能力,AI 便能摆脱对云端调度的绝对依赖,在真实场景中形成感知-规划-执行的闭环,真正具备与环境持续交互的主体性。

在这次对话中,我们试图沿着这一线索,理解一位同时身处学术前沿与产业一线的研究者,如何看待端侧 AI 的技术拐点、Agentic AI 从云端走向终端的系统演进,以及光子计算等底层硬件创新将如何重塑下一代智能设备的形态与边界。

以下是对话内容:

DeepTech:2026 年被称为 Agentic AI 元年,AI 正在从 chatbot 向可行动的 agent 转变。你如何理解这波 Agentic AI 热潮?它与此前的大模型热有何本质区别?

程远:这波热潮最核心的变化,是 AI 从“只会说”真正走向“会去做”。前一波大模型热潮更多聚焦在内容生成和问题回答,本质上是信息输出。而 Agentic AI 往前迈进了一步,它进入了任务闭环,需要感知环境、做出判断、调用工具,最终落实到具体的行动和动作。

最大的区别在于评判标准变了。以前大家关心模型聪不聪明,现在更关心它能否把交代的事情做完,而且要做得稳定、低延时、鲁棒可靠。这意味着问题已经不只是模型层面的问题,而是系统性问题。可以说,AI 的上半场解决的是"大模型能不能做出来",下半场要回答的是"能不能真正用起来,并且规模化部署"。Agent 热潮正代表了这个转折点。

DeepTech:目前大多数人谈到 Agentic AI 时,首先想到的是软件层面的 agent,比如前段时间很火的 OpenClaw 等智能体,它们能订机票、写代码、完成基础工作。但你做的是硬件和端侧 AI,能否介绍一下端侧 agent 与云端 agent 之间的关系?你曾表示 agent 的未来不一定在云端,这个观点基于什么考虑?

程远:我一直认为云端和端侧不是替代关系,而是分工关系。云端更像大脑,适合做复杂规划、长链条逻辑推理和知识调用。端侧则更像我们的反射神经,负责本地高频、实时性的闭环响应。

一旦进入物理世界,很多事情是等不起的。例如机器人的避障、数据抓取、安全防护,制造业的人机协作安全控制与效能提升, 以及消费设备的实时交互和响应,这些都要求在本地快速完成感知、计算和动作的闭环。不可能所有数据都传到计算中心再返回。

所以未来真正成熟的 agent,一定不只活在云端, 而是云端与端侧协同的系统。越贴近真实物理世界,这个趋势就越明显。因为在具身智能、先进制造、消费终端这些场景中,时延、功耗、带宽、隐私和成本都是绕不过去的约束。

DeepTech:为了更好的实现云端和端侧的协同,你重点研究的技术方向是"感算一体"。能否用通俗的语言解释一下什么是“感算一体”,它有什么特点?

程远:通俗来讲,感算一体就是不要把数据搬来搬去,而是在数据产生和收集的地方就把计算完成。传统架构里,感知、存储和计算是分开的。处理一个数据需要:采集—传输—存储—计算。这个过程消耗了大量通信开销,产生很多功耗和延时。实际上,很多中间花费都在数据搬运上,这部分甚至会占到总处理量的 70% 以上。

感算一体的特点是把计算融合到感知侧,让系统更快、更高效、更节约成本地处理多模态数据,比如视频流、音频流、传感信号等。它特别适合那种既要观察周边环境、又要马上做出反应的系统, 比如机器人、智能制造设备、消费电子终端。

DeepTech:但端侧 AI 客户面临“效率三角”的挑战:既要毫秒级实时响应、又要极低功耗和部署成本、还要处理视频流和时序信号这样的多模态数据。这三者在传统架构下似乎是互相矛盾的。感算一体是怎么同时解决这三个问题的?

程远:传统架构里,这三件事确实经常互相冲突。想要更快,就得堆算力;一旦堆算力,功耗和成本就会上去;再叠加多模态连续数据,系统复杂度又更高。所以很多方案实验室里能跑,到了现场就不经济了。

感算一体的关键,不是简单把功能实现,而是把链路做短,把很多无效的数据处理和通讯舍弃,在源头即完成计算、决策与行动。这样一来,实时性、功耗和成本就不再完全对冲。

比如在人机协作场景里,机器人需要实时判断人是不是进入危险区域、人与设备的距离是不是越界、当前动作是不是存在安全风险。这里真正需要的不是“看得很懂”,而是“发现风险就立刻响应”。再比如在消费终端,设备越来越强调本地实时交互,这时候系统既要低功耗常开,又要快速响应用户动作和环境变化。

DeepTech:传统架构的这个障碍一直存在。为什么过去十几年它没能大规模产业化?当时遇到了什么困难?

程远:这不只是概念性问题,更多是工程化难题。原理大家早就知道了,但过去一直难以产业化,因为它依赖全链条协同。不是说做出一款芯片、开发出某个算法、或者一个 SoC 模组就能支撑感算一体系统。它要求算法、芯片、传感、系统以及场景都一起打通,才能真正落地实现。

过去很多方案停留在实验验证阶段,本质上并没有回答工程上的关键问题:能不能稳定跑下去? 能不能适配不同场景? 能不能真正节约成本? 能不能量产交付? 这些问题解决不了,感算一体这个原理就无法变成产品。

我们团队这些年一直把这个问题当成系统能力来做,而不是单点技术,我们强调算力-算法协同设计方法,更强调从真实场景反推技术路线。所以归根结底,真正让感算一体技术落地的,不是某一个 demo,而是我们做到了系统级别的标准应用实现。

DeepTech:当前视觉端侧 AI 正在从简单的“判别式任务”(如 OCR、物体检测)向“生成式/世界模型任务”演进。如果当感知端不再只是输出一个坐标或标签,而是需要输出复杂的连续特征空间甚至是实时生成动作轨迹时,感算一体架构如何保持其功耗优势?它如何避免沦为只能处理简单任务的“特种芯片”,从而去承载更复杂的端侧 agent?

程远:感算一体架构不是为某些简单专用的“特种芯片”设计的,相反,它恰恰是为更复杂的端侧 agent 提供通用算力基础设施而提出。

传统端侧 AI 的问题在于,传感、存储、计算和执行是分离的。它先把物理世界里的连续信号采集下来,再搬运到后端芯片中计算。这个模式在判别式任务里还能工作,但当任务进入世界模型、动作生成和实时交互时,数据量、时延和功耗都会迅速放大。因为物理世界不是一张静态图片,而是视频、声音、触觉、运动状态和环境变化共同构成的连续多模态流。

感算一体的优势,是让计算更靠近数据产生的位置,在感知的瞬间就完成一部分结构化理解。它不是简单输出一个标签,而是把原始、高冗余、连续变化的物理信号,转化为更紧凑、更有语义、更适合 agent 使用的特征空间。因此任务越复杂、数据越连续,感算一体减少数据搬运和无效计算的价值反而越明显。

感算一体作为端侧智能的底层架构,未来一定会向通用化、可重构和可持续学习方向发展:既能处理视觉,也能融合声音、触觉、传感信号;既能支持固定任务,也能根据场景变化持续适配;既能服务判别式任务,也能支撑世界模型、动作规划和本地 agent 的自进化。

DeepTech:您将端侧比作反射神经,云端比作大脑。但以具身智能为例,目前的瓶颈往往在于“脑手不一”,云端理解了意图,但端侧系统无法精准执行。在您的研究中,如何解决端云之间的语义断层?为了实现真正的 Agentic AI,我们是否需要一种全新的、能够跨越云端与硬件层的统一通信协议?

程远:“脑手不一”确实是具身智能现在很大的问题。云端大模型可能理解了行动意图,但端侧系统真正执行时,面对的是传感器噪声、控制延迟和安全边界的不确定性。

具身智能正在走向分层架构,而不是所有智能都集中大脑里完成。云端更适合做高级计算,比如复杂规划、长链条推理、和多任务调度;端侧则需要具备原生智能,在本地完成高频、实时、安全的感知、决策和行动。“脑手不一”的本质,是高级语义和底层执行之间缺少中间层。

未来的系统会更像一个多 agent 协同体系:云端有规划 agent,端侧有数据 agent、安全 agent、效能 agent,每个关键传感器和执行部件都有局部智能。它们之间不是简单的 API 调用关系,而是需要新的任务表达、状态反馈和约束通信机制。

DeepTech:你认为现阶段把感算一体和具身智能结合,达到我们刚才描述的理想状态,最大的困难是什么?

程远:目前这是一个系统级的难题,需要从多个层面突破:

首先是算力层面,我们需要更大算力的芯片去部署能够在端侧执行任务的 agent 系统。其次是算法层面,需要轻量化更高效的算法架构去完成想要达到的功能。最后是系统层面,需要延迟非常低的软硬件协同设计去完成整体技术链路。我们采用感算一体这种架构,去完成算力和算法的完美融合,进而能够完成端侧自进化的 agent 任务。这是一个系统级别的难题,我们已经取得了很多突破。

DeepTech:为了解决算力问题,我发现你的研究还涉及光计算这些更前沿的方向。光计算和传统电子计算有什么本质不同?它所解决的是什么问题?

程远:最本质的区别,是它们依赖的载体和物理机制不同。传统电子计算主要靠电子迁移和晶体管开关,光计算更多利用光的传播、干涉、衍射这些过程来完成高并行计算。光计算算力能够带来的性能优势,是能效上提升 3-6 个数量级,计算速度上同样有 3 个数量级以上增益。

为什么现在大家重视光计算?因为今天 AI 对算力的需求增长太快了,电子体系在能耗和带宽上的压力越来越大,并且已经产生了显而易见的 AI 能源问题。很多时候问题不是算不出来,而是代价太高。尤其是大规模线性计算,也就是矩阵、张量这类计算,恰恰是光计算非常有潜力去承载的部分。

所以我对光计算的理解,不是它去替代一切,而是它提供一种新的高能效计算引擎。

DeepTech:光计算在能效比上有几个数量级的优势,但光电转换过程中的功耗损失和精度衰减一直是业界的痛点。您目前选择做‘加速插件’这种务实路径,是否意味着在现阶段,光计算依然无法摆脱对电子系统依赖的局面?在算力需求激增的当下,光计算面临的最迫切的挑战是什么?

程远:光计算的目标一定不是只做某些专用计算模块,而是走向可重构、通用化的大规模计算平台。它在信息维度、能耗和计算速度方面有天然物理优势,可以带来 3-6 个数量级的能效提升和延迟降低。当前光计算受制于器件工艺成熟度、系统鲁棒性等实际问题,所以现阶段最务实的路线,是先用光计算加速器切入 AI 里最密集、最耗能的部分,比如矩阵乘法、张量计算和并行推理。这样可以在不推翻现有体系的情况下,把光计算的优势先释放出来。

长期来看,光计算一定不会只是依附在电子芯片上的加速模块。真正的工程化挑战,是让计算、通信、存储尽可能都在光域里完成,减少甚至摆脱反复的光电转换。光计算的未来不是补充电子计算,而是在 AI 时代重构整个计算链路,用几个数量级的能耗优势,解决算力需求爆发和能源消耗之间的根本矛盾。

DeepTech:你觉得光计算会长期和硅基芯片、电子计算共存吗?

程远:我的判断会比较务实一点。中期来说,一定是共存的。但长期来看,光计算其实有机会走向一个更通用的平台,去大量取代电计算。因为光计算确实非常有潜力,它在功耗、通量和计算速度上面都有非常大的优势。

但我们实际来讲,它的难点也非常明确。不是说单个光计算单元拥有很高的处理速度,就能够去实现大规模的计算,而是说能不能把它做成一个可编程、可重构,通用化、能够接入现在计算生态的系统。如果把这些系统做出来,才能够完成对电子计算的替代逻辑。

目前更现实的路径是,中期来看,我们就把它作为一个高性能加速的插件切入进去,先替代比较适合它的那部分计算,然后再通过一些标准的接口和现有体系去兼容。长期来看,等到光电混合、封装校准、计算鲁棒性这些器件和电路级别的能力发展,伴随着一整条产业链的逐渐成熟,光计算一定是可以完成通用大规模落地实现,对传统电子计算形成强替代性。

所以这也是我目前推进光计算落地产业化的一个思路。我们不是一开始就把所有体系都推翻,去完全取代电计算,而是先从通用的光电加速卡做起,兼容目前已有的处理器架构和形态。

DeepTech:你在 2019 年就开始创业,当时你还在读博,是什么契机让你走上了这条道路?

程远:最直接的原因,还是我一直强烈地感觉到,AI 技术如果不落地实际场景,它的价值其实没有真正被释放出来。

我当时的研究方向就是 AI 软硬件协同设计,当时一边做科研,一边越来越清楚地看到,端侧 AI 在真实世界里有一个很大的“最后一公里”问题。大家都在谈模型发展有多快,但真正到了机器人、制造业和消费终端,卡住系统的往往不是模型精度,而是时延、功耗、成本和安全性。

所以创业对我来说,不是突然想换条路,而是想把研究里看到的方向,真正做成可落地的系统。辛米尔就是在这个背景下起来的。它让我更深入地理解真实场景,也让我更坚定一个判断:未来决定 AI 能不能走进物理世界的,归根结底还是算力-算法协同设计架构的基础建设。

DeepTech:你既是上交大副教授又是公司创始人,学术和产业之间是如何平衡的?为什么没有选择 all in 一个角色?

程远:这两个角色其实没有冲突关系,更多是互相校正。学术会逼着你去想第一性问题,去看五年、十年之后可能成立的新范式;产业会逼着你回到现实,去回答它今天能不能做、能不能落地、谁会真正买单。

我现在做的这个方向,本身就特别需要这两边同时在场。只做学术,容易停留在“看起来很对”;只做产业,又容易被短期需求牵着走,没法往更底层的架构层做突破。我更希望做的是,把前沿研究真正压到产业可用,再把产业里最真实的问题提炼回学术。这个闭环,对我来说是最重要的。

当学术和产业做的事情是同一目标时,其实是 1+1 小于 2 的,做相同的工作会产生数倍的结果,不会有精力难以分配的问题。

DeepTech:之前看过你在采访里说到一个关于未来的设想:想让智能计算像水电一样融入物理世界。你心目中的万物智能是什么样子的?到时候会呈现出什么样的形态?会让我们的生活发生哪些更具体、可感知的变化?

程远:我心里的万物智能,不是到处都是会聊天的机器,而是各种设备都开始具备即时感知、即时判断、即时行动的能力,而且这件事发生得很自然。也就是说,智能不再是一个单独的软件入口,而会像水电一样,慢慢变成基础能力,融在设备、系统和环境里。

更具体一点,未来的具身机器人不只是执行固定命令,它会自己做本地感知和行动决策;未来的制造设备不只是按程序运行,它会边运行边感知异常、边优化过程;未来的手持设备、智能车、智能家居、摄像头、无人机等也不只是被动响应,而会逐步具备更自然、更低延迟、更低功耗的本地智能交互能力。

很多今天看上去还比较“重”的智能能力,要耗费很多算力和能源资源,未来都会慢慢变成默认配置。我觉得背后真正的关键,不是让每个设备都像一个小型数据中心,而是让它们拥有低功耗、低时延、可以持续进化的基础算力。

运营/排版:何晨龙

注:封面/首图由 AI 辅助生成

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
欧尔班宣布辞职,私人飞机从维也纳起飞,资产转移国外?

欧尔班宣布辞职,私人飞机从维也纳起飞,资产转移国外?

流史岁月
2026-04-30 17:50:06
俄央行行长纳比乌琳娜称,俄罗斯民众的储蓄是经济的主要资金来源

俄央行行长纳比乌琳娜称,俄罗斯民众的储蓄是经济的主要资金来源

山河路口
2026-04-30 19:39:03
微软开源DOS 1.0!当年用不到10万美元拿下的代码,改写了整个操作系统史

微软开源DOS 1.0!当年用不到10万美元拿下的代码,改写了整个操作系统史

CSDN
2026-05-01 13:06:22
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
中东剧变:伊朗回马枪,以色列出兵阿联酋,沙特盼美国下岗?

中东剧变:伊朗回马枪,以色列出兵阿联酋,沙特盼美国下岗?

補懂事的孩紙
2026-05-01 19:01:11
没时间了,中方通牒送进东京,日本别无选择,高市已准备乘机离国

没时间了,中方通牒送进东京,日本别无选择,高市已准备乘机离国

轩逸阿II
2026-04-30 11:05:17
孙杨风波再发酵!家境被扒底朝天,父母身份曝光,马頔的话没说错

孙杨风波再发酵!家境被扒底朝天,父母身份曝光,马頔的话没说错

一盅情怀
2026-05-01 16:20:21
80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

80后家长发明“防早恋”发型,女儿面如死灰,网友都看不下去了

妍妍教育日记
2026-04-27 09:20:13
“穷人炫富,难掩心酸!”男大学生炫耀坐高铁一等座,因长相被嘲

“穷人炫富,难掩心酸!”男大学生炫耀坐高铁一等座,因长相被嘲

妍妍教育日记
2026-04-24 09:05:03
吉祥兄弟孙吉,娶上海白富美掏空家底,十年青训教父竟是骗局

吉祥兄弟孙吉,娶上海白富美掏空家底,十年青训教父竟是骗局

东方不败然多多
2026-05-01 18:39:13
38∶6!莎拉弹劾案僵持,中方怒拒马科斯求援,军方掀翻两大家族

38∶6!莎拉弹劾案僵持,中方怒拒马科斯求援,军方掀翻两大家族

壹知眠羊
2026-05-01 09:27:26
全A只有22个,市盈率低于10倍,利润增长10%以上,低估值高增长

全A只有22个,市盈率低于10倍,利润增长10%以上,低估值高增长

鹏哥投研
2026-05-01 10:13:50
2+8+9+3!最烂首发!掘金最快速度交易...

2+8+9+3!最烂首发!掘金最快速度交易...

技巧君侃球
2026-05-01 18:31:57
大雨暴雨、9级大风,大范围影响浙江

大雨暴雨、9级大风,大范围影响浙江

鲁中晨报
2026-05-01 17:43:04
“五一”上优酷看高清港版《射雕英雄传》,AI修复让经典焕新重现

“五一”上优酷看高清港版《射雕英雄传》,AI修复让经典焕新重现

娱乐硬糖
2026-04-30 21:15:37
女子200万买下废弃四合院,当晚院中槐树一夜开花,道士网友:快跑

女子200万买下废弃四合院,当晚院中槐树一夜开花,道士网友:快跑

古怪奇谈录
2025-08-05 15:36:06
重要调整!央视直播斯诺克世锦赛做2处改变,CCTV5直播吴宜泽

重要调整!央视直播斯诺克世锦赛做2处改变,CCTV5直播吴宜泽

云隐南山
2026-05-01 10:20:12
朱高炽的经济账:停止下西洋,计划撤军安南,准备迁都,只为省钱

朱高炽的经济账:停止下西洋,计划撤军安南,准备迁都,只为省钱

铭记历史呀
2026-04-30 19:24:04
五一假期开场大范围降水来袭 南北方气温明显下滑

五一假期开场大范围降水来袭 南北方气温明显下滑

北青网-北京青年报
2026-05-01 08:25:11
1936年,张学良活捉蒋介石前的合影,注意看两人表情,已貌神合离

1936年,张学良活捉蒋介石前的合影,注意看两人表情,已貌神合离

浩渺青史
2026-04-30 21:28:09
2026-05-01 19:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16650文章数 514912关注度
往期回顾 全部

科技要闻

苹果上季在华收入继续大增 iPhone收入新高

头条要闻

特朗普发了张图 伊朗外长回应:犯了个"可怕的错误"

头条要闻

特朗普发了张图 伊朗外长回应:犯了个"可怕的错误"

体育要闻

无奈!约基奇:这要在塞尔维亚 全队早被炒了

娱乐要闻

邓超在景德镇被偶遇,穿黑外套逛茶园

财经要闻

GPU神话松动,AI真正的战场变了

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

亲子
时尚
艺术
游戏
本地

亲子要闻

宝蓝和爸爸比赛吹气球,吹成各种各样的形状,快来看看谁赢了~

她们看起来气血好足,每套搭配我都想抄

艺术要闻

Nikolai Vryasov:当代俄罗斯画家

Switch国行即将永久关闭服务器!不想变砖就做好这些

本地新闻

用青花瓷的方式,打开西溪湿地

无障碍浏览 进入关怀版