网易首页 > 网易号 > 正文 申请入驻

Spark团队6年前埋的伏笔,被AI代理系统抄了个底朝天

0
分享至

1990年代我们学会了分布式存储,2000年代学会了分布式计算,2010年代用MapReduce和Spark搞定了大规模数据处理。每隔十年,软件行业就把同一套分布式系统的难题重新解一遍,只是换了个底层介质。2026年,轮到了分布式推理。

一个架构师花了一年时间搭建代理式AI(Agentic AI,指能自主规划、调用工具并执行多步骤任务的AI系统)系统,直到他把这些代理映射回自己烂熟于心的Spark执行模型,一切才豁然开朗。这不是什么灵光一闪的顿悟——是同一套剧本被翻拍了第四遍。

Spark的DAG执行图,早就是代理协作的说明书

Spark的核心抽象是弹性分布式数据集(RDD,Resilient Distributed Dataset),代理式AI的核心抽象是"智能体"(Agent)。但两者的执行骨架几乎一模一样。

Spark把计算拆成有向无环图(DAG,Directed Acyclic Graph),每个节点是转换操作,边是数据依赖。代理式AI把任务拆成规划图,每个节点是一个工具调用或推理步骤,边是执行顺序。Spark的调度器决定哪个任务派给哪个执行器;代理系统的编排器(Orchestrator)决定哪个代理处理哪个子任务。Spark用血统(Lineage)机制做容错——任务失败就重算依赖链;代理系统用检查点(Checkpoint)和重试策略做容错。

作者提到一个细节:Spark的宽依赖(Wide Dependency)会触发Shuffle——数据要跨节点重新分区,代价极高。代理系统里对应的噩梦是"上下文切换":一个代理把中间结果扔给另一个代理,信息在传递中膨胀或丢失,协调成本指数级上升。2010年代Spark工程师花大力气优化的Shuffle优化器,2020年代的代理架构师正在重新发明一遍。

协调成本:从数据倾斜到"智能体倾斜"

Spark最怕数据倾斜——某个分区数据量暴涨,单个执行器被拖垮,整个作业卡住。代理系统出现了完全对称的问题:某个代理被分配了过于复杂的子任务,推理链过长,token消耗失控,成为瓶颈节点。

Spark的解决方案是动态资源分配和任务推测执行(Speculative Execution)——慢任务被检测到后,系统在别处启动副本,谁先完成用谁的结果。代理系统正在照搬这套:监测代理的响应延迟和token消耗,超时自动重启替代实例。

作者的原话是:「How do you manage the cost of coordination? How do you handle failures in one part of a system without bringing down the whole?」——这三个问题从分布式存储时代问到分布式推理时代,答案的轮廓没变,只是填充的细节换了。

为什么Spark老手能更快上手代理架构

作者坦承,自己花了一年才想通这层映射,但一旦想通,设计决策变得异常清晰。Spark社区用十年时间踩过的坑——广播变量的使用场景、累加器的并发陷阱、内存溢出的诊断模式——在代理系统里以不同面貌重现。

一个具体例子:Spark的广播变量(Broadcast Variable)用于把只读数据分发到所有节点,避免重复传输。代理系统里对应的模式是"共享上下文"——把用户意图、环境约束等全局信息注入所有代理,防止每个代理重复向大模型询问基础设定。没有Spark背景的人可能会让每个代理独立解析需求,token账单爆炸;有Spark背景的人第一反应就是"这得广播"。

2026年的代理系统,正在复刻2016年的Spark生态位

Spark诞生于UC Berkeley的AMPLab,2010年开源,2014年成为Apache顶级项目,2016年前后全面取代MapReduce成为大数据处理的事实标准。它的崛起路径是:先解决一个具体痛点(迭代式机器学习在MapReduce上太慢),再泛化为通用计算引擎,最后孵化出流处理(Spark Streaming)、SQL(Spark SQL)、图计算(GraphX)等垂直扩展。

代理式AI的2026年,正处于Spark 2014年的阶段——基础执行模型被验证,但上层抽象还在混战。LangChain、LlamaIndex、AutoGen、CrewAI等框架相当于Spark之前的Hadoop生态:各自定义API,互不兼容,用户被困在选型焦虑里。作者预测,接下来两年会出现"代理系统的Spark时刻"——某个执行引擎统一抽象层,像Spark统一批处理和流处理那样,统一单代理和多代理编排。

那个时刻到来时,现在的框架要么像MapReduce那样退居历史脚注,要么像Hive那样被吸纳进新生态的表层语法。

作者最后抛了一个问题:如果代理式AI真的在复刻Spark的技术史,那么Spark社区花了十年才成熟的容错机制和调度优化,代理系统需要多久?他的答案是——不会更快,但也不会更慢,因为「we've built this before」。

问题是,2026年入场的架构师,有多少人愿意承认自己只是在重走2010年代的老路?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
12分钟对轰4球 欧冠半决赛巅峰对决精彩到荒谬 12.1亿豪门5-4复仇

12分钟对轰4球 欧冠半决赛巅峰对决精彩到荒谬 12.1亿豪门5-4复仇

狍子歪解体坛
2026-04-29 04:57:56
跌落神坛!40岁诺伊尔全场0扑救 让大巴黎5次射正进5球 仅获5.2分

跌落神坛!40岁诺伊尔全场0扑救 让大巴黎5次射正进5球 仅获5.2分

我爱英超
2026-04-29 05:22:10
我在沙特开餐馆娶了3位妻子,回国奔丧一星期,再回去时当场愣了

我在沙特开餐馆娶了3位妻子,回国奔丧一星期,再回去时当场愣了

千秋文化
2026-04-28 20:17:01
人事 | 张柱任农业农村部党组书记

人事 | 张柱任农业农村部党组书记

天津广播
2026-04-28 21:22:58
Claude自己上“闲鱼”:砍价成交186单,实验结果反直觉

Claude自己上“闲鱼”:砍价成交186单,实验结果反直觉

智东西
2026-04-27 18:08:21
米饭被点名!医生直言:米饭冷冻24小时,抗性淀粉翻倍控糖护肠

米饭被点名!医生直言:米饭冷冻24小时,抗性淀粉翻倍控糖护肠

路医生健康科普
2026-04-26 19:55:03
中国正式禁止美国收购Manus,美媒集体破防指责

中国正式禁止美国收购Manus,美媒集体破防指责

空间展示知识
2026-04-28 11:51:13
随着利雅得新月1-0,沙特联最新积分榜出炉:C罗率队5分优势领跑

随着利雅得新月1-0,沙特联最新积分榜出炉:C罗率队5分优势领跑

侧身凌空斩
2026-04-29 04:03:30
24小时内,中俄兵分两路,普京接见伊朗外长,特朗普做出巨大让步

24小时内,中俄兵分两路,普京接见伊朗外长,特朗普做出巨大让步

坠入二次元的海洋
2026-04-28 19:50:47
丢人现眼!女子老太地铁互殴后续:官方介入,真相曝光,恐将社死

丢人现眼!女子老太地铁互殴后续:官方介入,真相曝光,恐将社死

派大星纪录片
2026-04-28 16:23:41
阿联酋发表声明:自5月1日起退出欧佩克及欧佩克+

阿联酋发表声明:自5月1日起退出欧佩克及欧佩克+

财联社
2026-04-28 20:24:29
10年19冠!曼城官宣31岁功勋自由身离队 周薪25万  意甲3豪门哄抢

10年19冠!曼城官宣31岁功勋自由身离队 周薪25万 意甲3豪门哄抢

我爱英超
2026-04-28 20:29:10
4000万粉网红白冰,偷税超900万被查!从发廊小哥到富豪,靠“接地气、不割韭菜”立人设!

4000万粉网红白冰,偷税超900万被查!从发廊小哥到富豪,靠“接地气、不割韭菜”立人设!

新民周刊
2026-04-28 20:08:08
巴黎5-4拜仁!金球先生2射1传 9000万飞翼双响 单场9球创欧冠纪录

巴黎5-4拜仁!金球先生2射1传 9000万飞翼双响 单场9球创欧冠纪录

我爱英超
2026-04-29 04:59:25
不当总统了?马克龙将卸任,临走前通告全球:中美俄都在针对我们

不当总统了?马克龙将卸任,临走前通告全球:中美俄都在针对我们

共工之锚
2026-04-28 00:08:09
济南文旅因夏雨荷引热议:大明湖底的十万亡魂,济南人可还记得

济南文旅因夏雨荷引热议:大明湖底的十万亡魂,济南人可还记得

十为先生
2026-04-28 14:53:25
辛柏青回应吴越撮合,没有翻脸没有接梗,把分寸和家人稳稳守住

辛柏青回应吴越撮合,没有翻脸没有接梗,把分寸和家人稳稳守住

一盅情怀
2026-04-28 17:18:29
跌回20年前!权威数据表明,中国房地产的实际购买力已跌至2006的水平

跌回20年前!权威数据表明,中国房地产的实际购买力已跌至2006的水平

风向观察
2026-04-28 16:20:39
云南14岁男生杀害同班15岁女生,一审被判处无期徒刑;女孩父亲终日借酒浇愁已饮酒300斤

云南14岁男生杀害同班15岁女生,一审被判处无期徒刑;女孩父亲终日借酒浇愁已饮酒300斤

大风新闻
2026-04-28 17:08:25
河北一中学教师买卖8支玩具仿真枪获刑三年,申诉被驳回

河北一中学教师买卖8支玩具仿真枪获刑三年,申诉被驳回

澎湃新闻
2026-04-28 16:06:27
2026-04-29 05:36:49
摸鱼算法
摸鱼算法
致力于用最前沿的AI技术,换取更多发呆时间的三十岁青年。
1872文章数 18关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

体育要闻

魔术黑八活塞,一步之遥?!

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

健康
亲子
游戏
本地
公开课

干细胞治疗烧烫伤三大优势!

亲子要闻

拍这期视频时眼泪止不住地流

这不爽翻了?曝PS6或能稳稳运行60帧+光追的游戏画面

本地新闻

用青花瓷的方式,打开西溪湿地

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版