![]()
新智元报道
编辑:peter东
【新智元导读】多年来,AGI(通用人工智能)如同科幻迷雾中的海市蜃楼——顶尖研究者们对其定义各执一词,甚至以「看到才知道」的模糊共识回避争论。然而,一场静默的革命正在发生:长程智能体(Long-horizon Agents)的突破,让AGI从哲学辩题落地为功能现实。
多年前,一些顶尖研究者告诉红杉,他们的目标是实现通用人工智能(AGI)。
当时,红杉天真地问:「你们如何定义AGI?」
他们停顿片刻,略带犹豫地相视一眼,然后给出了一个后来几乎成为AI领域某种信条的回答:
「嗯,我们各自都有自己的定义,但等我们看到它时,自然会知道。」
这就是大家对AGI具体定义的不懈追寻的见证之一。
事实证明,这个定义确实难以捉摸。
虽然定义难以明确,现实却非如此。
AGI已经到来,就在当下。
编码智能体是第一个例证。未来还会有更多。
长远规划智能体在功能上已相当于AGI,而2026年将属于它们。
![]()
AGI不再是哲学辩论,
而是你的「虚拟同事」
硅谷AI初创公司创始人马克自述他的经历,曾经招聘一个人,需要发布职位描述,筛选数百份简历,初筛50人,面试15人,最后发出offer。总共要耗时数周,成本上万。
如今只需要给智能体指令:「我需要一个懂Kubernetes、有开源贡献、能在开发者社区建立影响力的工程总监」。
智能体按分钟推进:
0-5分钟:扫描GitHub,筛选5000+个Kubernetes相关仓库,识别活跃贡献者 。
5-15分钟:交叉验证LinkedIn、技术博客、会议演讲记录,筛掉那些僵尸账号。
15-25分钟:分析推特互动质量,去掉以及只转发雇主文章的人,识别真正有影响力的开发者。
25-31分钟:发现目标人选刚结束大厂项目,撰写个性化邀约邮件。
从接到需求到获得精准候选名单,仅31分钟。
上述场景,来自红杉发布的博客。文中用「能把事儿搞定」,来通过功能性重新定义了AGI,称当下的长程智能体已跨过关键门槛;AI应用将从「对话者」升级为「执行者」,可以被视为AGI了。
长程智能体的发展轨迹
AGI的发展,有三个关键时刻。
第一个是知识,源于预训练,代表事件是2022年末发布的ChatGPT。
第二个是推理时计算,可以对应2024年OpenAI的o1及2025年初的DeepSeek R1。
第三个关键点是迭代/长程智能体,其代表事件是在过去的几周内,Claude Code和其他编程智能体跨越能力阈值。
具有通用智能的人,能够独立工作数小时,自己犯错后修正,并在无需被告知的情况下弄清楚下一步该做什么。通用人工智能也要能做到同样的事情。
![]()
图1:不同历史阶段的人工智能能够完成的任务耗时
2025年3月的一篇研究[2],发现了一个智能体领域的摩尔定律:
在过去6年中,智能体能够完成的任务时长,一直呈指数级增长,约每7个月翻一番。
这可比摩尔定律的18个月翻一番快得多。这意味着智能体能力的增长,要远快于硬件性能的增长。
这里的任务,涵盖了软件编程上的各类问题,相当广泛,而上述结果不依赖于特定的数据集,其结论相当鲁棒。
根据这一趋势预测,在未来不到十年内,我们将看到AI智能体能够独立完成当前需要人类花费数天或数周才能完成的软件编程任务。
在2025年3月,那时的大模型在人类完成时间少于4分钟的任务上几乎有100%的成功率,但在人类需要花费超过大约4小时的任务上,成功率低于10%。
而按照历史经验外推,能以50%概率成功完成的多步任务数,大约每年增长1-4倍。
如果过去6年测量的趋势在未来2-4年内继续,2028年智能体可完成人类专家一天工作量;到2030年,通用型自主智能体将能够执行一系列为期一周的任务,而2037年或能处理需专家百年时间的任务。
一个能够替代人类专家终其一生才能解决问题的智能体,说什么都该被视为通用人工智能了。
这就是红杉这篇文章真正想说的。不必纠结通用智能的定义及其哲学争论。只要能把事儿搞定,就是通用智能。
这种强调结果的思考方式,更关注现实影响,无论是投资者,创业者还是打工人,都需要押注智能体能力的指数增长曲线,据此重估创业与商业机会。
明白通用人工智能
打工人要转变思路
2023-2024年的AI应用多为「对话工具」,而2026年后,智能体将成为「虚拟员工」。
医学领域,OpenEvidence的深度咨询功能可以进行医疗咨询。
在法律界,智能体Harvey可以担任助理律师。
即便是芯片设计,也有发表了AlphaChip的研究者创立了「Ricursive Intelligence」。
![]()
2026年和2027年的AI应用将从对话者成为行动者。它们将像同事一样存在。使用频率将从每天几次增加到全天候,同时运行多个实例。
智能体将不止是让用户节省几个小时,而是让用户角色从「个人贡献者」转为「管理一组智能体」。
对于打工人来说,能够完成长任务周期的智能体,其能力与大模型的单次调用有着本质的不同。
每一个人都需要思考,在你的领域,长时程的智能体解锁了哪些新能力?哪些任务需要持久的注意力,如今这些任务是时候外包给AI了。
等到这些任务外包给AI之后,需要人来思考并回答下面三个问题
1. 如何将AI自动化的工作产品化推广出去?你能对此定价和包装以创造价值吗?
2. 工作界面从聊天机器人发展到智能体,将在你的领域如何影响人机互作?
3. 如何在智能体完成任务的过程中提供反馈,从而让智能体能够可靠而稳定地完成复杂任务,而非痴迷改进智能体的接口。
此外,能完成长时间任务的智能体的出现,也会带来更多的隐患。曾经大模型的安全,只需要考虑会不会回复有害问题,而在连续工作几个小时,去解决复杂问题的智能体上,就要小心智能体「删库跑路」,或者侵犯个人隐私,将人类世界的偏见引入等问题了。
监管缺失也不容忽视,目前尚无法律定义「智能体作为员工」的权利义务。A调用B公司提供的智能体完成的特定任务,所引起的合同纠纷、责任认定等问题仍悬而未决。
参考资料:
https://sequoiacap.com/article/2026-this-is-agi/
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.