![]()
200万美元,34个月,DARPA想解决一个听起来很虚的问题:AI之间到底该怎么聊天,才能真的搞出科学发现。
不是让ChatGPT写周报那种聊天。是让一群各自专精不同领域的AI代理(Autonomous Agents,自主智能体),像实验室里凑在一起喝咖啡的研究员那样,互相丢想法、挑毛病、最后碰撞出连人类都没想过的假设。
五角大楼这个研究部门周二刚发布的MATHBAC项目,全名"提升代理通信的数学原理"(Mathematics of Boosting Agentic Communication)。名字拗口,但野心直白:现在的AI能解题,但不会"想问题";能优化已知方案,但系统性探索假设空间的能力几乎为零。
为什么聊天也需要"科学"?
DARPA的吐槽很毒:当下AI发展是"启发式引导"——说人话就是拍脑袋试错。堆算力、调参数、看结果,行就留下,不行就扔。至于为什么行,不知道。
代理之间的通信也一样。两个AI交换信息,目前基本是黑箱操作。它们能对话,但没人说得清对话效率怎么样、信息有没有损耗、协作模式能不能迁移到别的领域。
「虽然AI擅长在解空间(Solution Space)里导航,但它难以系统性探索假设空间(Hypothesis Space),而后者正是产生变革性、可泛化科学洞见的关键。」DARPA在项目公告里写道。
MATHBAC想做的,就是给这种聊天建立"严格的数学基础"。不是让AI更会说话,是让AI之间的对话本身成为可研究、可优化、可预测的对象。
两阶段,两个硬核目标
第一阶段18个月,砸钱搞两件事。
第一件事是通信协议的数学化。设计代理之间交换信息的规则,用数学证明什么样的对话结构能让协作效率最大化。这有点像给AI制定"会议室礼仪"——谁先说、说什么、怎么回应、什么时候打断,全部量化。
第二件事更刁钻:优化通信的"内容"。DARPA想要AI从对话里提炼"原则"——定律、相关性、紧凑且可泛化的知识碎片,然后把这些"金块"存进共享记忆模块。
举个例子:一群分别研究流体力学、材料学和热传导的AI,面对一组实验数据。数据暗示了某种跨领域的规律,但没明说。MATHBAC希望这些AI聊完之后,能自己把这个规律抽象出来,变成所有代理都能调用的常识。
换句话说,它们不仅要交换已知信息,还要在对话中"共同发现"未知知识。
第二阶段16个月,把第一阶段的数学成果塞进实际的多代理系统里测试。最终目标是让AI代理的科研发现效率出现"突破性提升"。
这笔钱赌的是什么?
DARPA的赌注背后有个判断:单个大模型已经摸到天花板了。GPT-4、Claude、Gemini再强,本质上还是在人类已有的知识里做检索和重组。真正的科学突破——像牛顿从苹果落地想到万有引力那种跳跃——需要假设空间的系统性探索,而这是单体AI的盲区。
多代理协作被看作一条出路。但现在的多代理系统,通信基本是"传话":A把结果扔给B,B加工完扔给C。信息在传递中损耗,代理之间没有真正的"讨论"。
MATHBAC想升级成"辩论"模式。让AI互相质疑、补充、修正,在对话中压缩信息冗余,提取高价值洞见。这要求的不只是更强的单个模型,而是对"协作认知"本身的数学建模。
项目公告里有个细节值得玩味:DARPA特别强调要研究"通信内容的特征",而不是仅仅优化协议。这说明他们意识到,AI聊什么,比怎么聊更重要。两个博士聊八卦,和聊各自领域的交叉问题,信息密度天差地别。
为什么是DARPA来干这个?
民间AI公司也在搞多代理,但逻辑完全不同。OpenAI的Swarm、AutoGPT的各种变体,追求的是任务完成——订机票、写代码、生成报告。通信效率是手段,不是研究对象。
DARPA要的是"科学发现"这个更模糊、更高风险的目标。这意味着他们愿意资助短期内看不到产品化的基础研究,而这是商业公司很难承担的。
200万美元在AI研发里不算大钱,但MATHBAC的信号意义明显:五角大楼认为,AI的下一个瓶颈不是算力,不是数据,而是"社交能力"——让机器学会像科学家一样协作思考。
如果这套数学框架真能建立,影响会超出国防领域。药物研发、气候建模、材料设计,任何需要跨学科碰撞的领域,都可能受益。
当然,风险同样清楚。34个月后,DARPA可能拿到一套漂亮的公式,也可能发现"AI科学对话"本质上不可建模——毕竟人类科学家开了几百年会,也没总结出什么"会议数学"。
项目 solicitation 已经开放,感兴趣的研究团队可以开始写标书了。一个悬念是:如果最后真有一群AI代理聊出了人类没想到的科学原理,第一作者该写谁?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.