作品声明:个人观点、仅供参考
2025年已临近尾声。
你知道当前科技圈最热门的领域是什么吗?
不是年初刷屏的DeepSeek,也不是GPT-5,而是“智能体”。
它并非简单的AI聊天工具,而是真正具备自主能力的智能实体。
长久以来,全球每一家科技公司都在向我们传递同一个梦想。
打造一个无缝衔接、功能全能,甚至能预判我们每一个需求的数字管家,就像《钢铁侠》中的贾维斯。
![]()
这个设想中的“贾维斯”,既能帮你预订机票、编写代码,还能监督健康饮食。
甚至在你深夜11点想下单啤酒烧烤时,智能地断开服务以守护你的健康。
但现实却并非如此。
当你真正使用市面上那些号称“智能体”的产品就会发现,它们远非贾维斯那般智能,更像是套着“智能”外壳的固定工作流。
面对稍微复杂一点的任务,就会陷入“能力瘫痪”,无法正常推进。
一边是科技巨头们疯狂投入资金布局智能体领域,另一边是普通用户使用后直呼“落差太大”。
这种梦想与现实之间的巨大鸿沟,究竟因何产生?
![]()
智能体要真正落地,缺的不是更擅长生成文案的大模型,而是设备能力这块关键拼图。
当前的终端设备,根本没有为真正的智能体做好准备。
要补上这块拼图,必须先解决三个硬核问题。
一是算力、内存与带宽之间相互制约,难以协同突破。
二是硬件与系统生态过于碎片化,兼容性不足,三是全天候感知需求与设备电池续航之间的矛盾,难以兼顾。
解决问题的思路其实并不复杂。
不再需要我们手动点击屏幕、寻找APP,只需下达指令,系统就能自主协调手机、电脑、汽车、耳机,甚至智能马桶等所有设备,构建一个以用户为中心的“计算星系”。
这个概念听起来或许有些抽象,但它的定义其实十分明确。
![]()
2024年,人工智能领域权威学者李飞飞发表了一篇关于智能体AI的研究综述,强烈推荐大家阅读。
其中将智能体定义为“具备观察、思考、行动能力的交互系统”,核心关键词包括感知、多模态与行动——这与ChatGPT有着本质区别。
当向ChatGPT提出问题,它会给出精准答案,但始终处于“被动响应”状态。
而真正的智能体是“主动执行”的。
你只需给出一个目标,比如“规划一次全家去上海的旅行”,它会自主将目标拆解为查询机票、预订酒店、规划路线、筛选餐厅等具体任务,还能主动联网搜索、调用API接口,甚至控制家中其他智能设备协同工作。
若过程中出现偏差,它还能自主修正,直至任务完成。
咨询巨头Gartner更是将“智能体AI”(Autonomous AI Agent)列为2025年十大战略技术趋势之首,并预测到2028年,人类15%的日常工作决策将由智能体AI自主完成。
明明前几年就已出现的概念,为何直到现在才迎来爆发?
![]()
他们要打造的不是单一功能的AI Agent,而是更宏大的“智能体生态”(Autonomous AI Ecosystem)。
这两个概念看似相近,实则差异如同单个APP与完整操作系统。
当前市面上多数教程教的是如何开发订票机器人、新闻总结工具,这类工具虽实用,却只是单一功能的AI应用,如同计算器、天气APP一般,难以推动底层技术革命。
而智能体生态,指的是一群各司其职的智能体协同工作。
有的负责处理语音信息,有的专注图像识别,有的在本地完成推理计算,有的在云端承担 heavy 任务。
它们像接力赛一样传递任务,共同完成复杂目标。
这并非单一应用,而是一套协同工作的体系,能跨越所有设备,不妨想象你是“太阳”,所有设备是围绕你的“行星”,AI则是“引力”。
让数据、指令与动作都围绕你运转,而非你围着设备忙碌。
![]()
第二个原因是端侧小模型的能力大幅提升。
人们逐渐意识到,并非所有场景都需要云端运行的万亿参数大模型。
很多时候,为了追求更快的响应速度、更强的隐私保护与更个性化的体验,在设备本地运行一个数十亿参数的小模型,会是更优选择。
第三个原因来自终端设备的爆发式增长。
马斯克曾发推表示,未来大量AI计算将发生在终端层;安蒙也回应称“高通早已预判这一趋势”。
事实上,高通目前已支持超过20亿个可运行AI的边缘节点。
![]()
当感知能力与智能技术相结合,几乎所有产品都值得用AI重新改造。
从手机、电脑到车机、耳机,再到智能手表、头戴设备,硬件普遍搭载了NPU(神经网络处理单元)这类AI加速器。
其实让身边的设备终于成为一个个“边缘AI节点”,它们协同工作,就能带来前所未有的智能体验。
只不过AI助手每隔几秒就会“失忆”,只因读取历史对话数据的速度太慢。
因此,未来判断一台设备是否为“AI原生设备”,核心要看内存规格。
跨应用、跨设备、云边端协同看似美好,实则是安卓碎片化问题的终极放大版。
让一个APP在不同品牌、不同尺寸的安卓手机上正常显示,已足够让开发者头疼,如今要让复杂AI任务。
这些设备的操作系统、芯片架构、硬件规格、连接方式各不相同,还存在各种数据壁垒,协同难度极大。
总结来看,—端测算力与内存限制、跨设备协同的碎片化、全天候感知的续航矛盾。
环环相扣,要同时解决,需要企业在设备连接、算力优化、低功耗设计与软件生态上全面突破。
![]()
当然,其他阵营也在积极探索,只是路线各有不同。
苹果选择“端侧+私有云”模式:将重计算任务交给云端,端侧负责理解用户意图、守护隐私边界,体验流畅,但在苹果生态之外难以兼容,如同“信息孤岛”。
安卓阵营则在系统中常驻端侧模型(如Gemini Nano),通过统一接口方便开发者接入。
—优点是开放,缺点也源于开放,设备品牌、硬件规格差异大,要让所有厂商保持一致的体验,难度极高。
![]()
PC领域今年也在发力,例如英特尔酷睿Ultra处理器已将NPU性能拉满,本地长上下文处理、常驻代理等功能逐步完善,单机体验强劲。
但如何将手机、可穿戴设备无缝融入PC生态,仍需时间探索,尤其要解决“用户移动时,PC任务如何顺畅衔接”的问题。
对比来看,不同路线的核心差异集中在三点。
端侧与云端如何分工,能否跨越应用、设备与计算模式,主动提供服务,设备连接与续航能力能否支撑全天候工作。
从这一角度看,高通是目前少数能同时应对算力、碎片化、续航三大挑战的企业之一。
那么,智能体的终极形态究竟是什么?
Gartner预测,到2029年,人类80%的常见问题将由智能体自主解决,人们将与世界的交互将不再局限于点击、滑动屏幕,而是通过语音、手势,甚至意念,在各种场景中自然发生。
![]()
由此可见,智能体可能会彻底改变过去15年由智能手机与APP构建的“注意力经济”。
过去15年,无数APP通过各种方式争夺用户注意力,鼓励短平快的内容消费与交互。
未来,当交互不再依赖屏幕与图标,我们的注意力终于能回归真正重要的事情。
无需关心APP图标是否美观,只需关注服务能否被智能体稳定、高效地调用。
如果智能体AI能在端侧打通理解、规划、行动的完整闭环,或许这一次,科技真的能让人们少花时间在操作设备上,多做成一些真正有价值的事。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.