出品 | 《态度》栏目
作者 | 纪川
编辑 | 定西
看完Create 2026,我惊讶的发现,李彦宏过去三年的判断,居然都正在被现实一一兑现。
过去三年,李彦宏在AI上的几个重要判断,几乎都曾是“非共识”。2024年,当大模型公司还在疯狂训练参数、比拼排行榜时,他开始反复强调:“卷应用,不卷模型”;当行业还在寻找下一个ChatGPT式超级App时,他判断,“智能体会成为AI应用最主流的形态”;当很多人还在谈“超级应用”时,他又提出,AI时代真正重要的,不是一个超级App,而是“数百万超级有用”。
这些判断,在当时都不算主流。
但到了2026年再回头看,它们正在变成行业共同语言:模型能力不再是唯一战场,AI应用开始进入真实业务流,Agent从概念走向产品,普通人也开始用自然语言开发应用、经营业务、完成过去只有团队才能完成的工作。
在Create 2026上,李彦宏进一步提出了一个新的概念:DAA,Daily Active Agents,日活智能体数。
![]()
在李彦宏看来,AI时代真正重要的,不再是有多少用户打开App,也不是消耗了多少Token,而是每天到底有多少智能体,在真实世界里替人完成任务、交付结果。
如果说DAU是移动互联网时代的度量衡,Token是大模型时代早期的成本刻度,那么DAA更像是智能体时代的价值刻度。它把AI行业的讨论,从“模型有多强”“成本烧了多少”“用户来了几次”,重新拉回到一个更本质的问题:AI到底替人做成了多少事?
1、DAA是什么?李彦宏想替换掉的,不只是一个指标
商业史上的每一次技术更迭,几乎都伴随着度量衡的重写。PC互联网时代,行业看PV、UV。谁有流量,谁就有机会。移动互联网时代,DAU成为最核心的指标。用户每天是否打开、停留多久、是否形成习惯,决定了一个App的商业价值。
到了大模型爆发的前两年,行业又迅速陷入对Token、参数量、榜单和跑分的追逐。这些指标当然有意义,但它们的问题也越来越明显。DAU回答的是“人有没有来”,Token回答的是“模型消耗了多少”,跑分回答的是“模型在标准测试里表现如何”。
但它们都无法回答一个更朴素、更商业的问题:AI到底产出了什么价值?
一个AI应用可以有很高的访问量,但用户可能只是来试一试、聊一聊;一个模型可以消耗大量Token,但Token本质上首先代表的是成本,而不是收益;一个模型可以在榜单上表现很好,但它未必能在复杂、混乱、不可控的真实场景里,把任务稳定做完。
这正是李彦宏提出DAA的背景。
按照他的定义,DAA就是Daily Active Agents,日活智能体数。更直白地说,就是每天有多少个Agent在给人类干活,并交付结果。
这个定义的关键,不在“日活”,而在“Agent”。过去移动互联网讲DAU,衡量的最小单元是“人打开App”。今天讲DAA,衡量的最小单元变成了“智能体完成任务”。
这背后是两套完全不同的产业逻辑。移动互联网的核心,是抢占人的注意力。一个用户打开App、停留、点击、转化,流量就有了商业化空间。智能体时代的核心,则不是让人多看几分钟屏幕,而是让AI替人少做几小时工作。
它的价值不在“占用时间”,而在“释放时间”。所以,从DAU到DAA,本质上是从互联网逻辑到Agent逻辑的迁移:DAU衡量的是人是否打开;Token衡量的是模型消耗;DAA衡量的是Agent是否真正完成任务。
这也是为什么DAA比Token更接近价值。
![]()
Token可能意味着更长的上下文、更复杂的推理、更高的成本,但如果没有交付结果,它只是算力账单上的数字。DAA则要求智能体进入任务链条,承担具体角色,并产生可验证的结果。
比如,一个智能体帮电商商家处理客诉、清洗销售数据、生成备货建议、制作营销海报,并搭建秒杀页面;一个智能体帮制造工厂识别安全隐患、生成巡厂报告、持续学习产线管理规则;一个智能体帮银行员工查流程、找材料缺口,减少客户等待时间。
这些都不是“聊天”,而是“干活”。
从这个意义上看,DAA并不是一个凭空发明的新指标,而是AI产业发展到Agent阶段后,对“价值发生在哪里”的重新校准。
李彦宏第一次把AI的价值锚点,从“能力”重新拉回“结果”。
2、这不是突然冒出来的新概念,而是一条连续三年的判断线
如果只看Create 2026,DAA像是一个新概念。但如果把时间线拉长,会发现它其实是李彦宏过去三年AI判断的自然延伸。
第一阶段,是2024年的“卷应用,不卷模型”。
那时,大模型行业的主战场仍然是参数、榜单和模型能力。几乎所有公司都在讲更大的模型、更强的推理、更高的分数。李彦宏当时的判断并不讨巧:模型本身会逐渐趋同,真正拉开差距的是应用和生态。
这句话放在当时,并不是共识。因为行业仍然相信,只要训练出足够强的模型,就会自然涌现出类似ChatGPT的超级应用。但现实很快证明,模型能力只是起点,真正的难点在于如何把AI嵌入具体场景,变成可持续使用的产品和工作流。
第二阶段,是2024年下半年开始,他反复强调智能体会成为AI应用最主流的形态。
当时行业还在寻找“下一个超级App”。但李彦宏的判断是,AI原生时代的信息、内容和服务载体,不一定是某一个超级入口,而可能是大量Agent。这个判断的核心在于:AI应用不是把聊天框做得更聪明,而是让模型拥有工具调用、任务规划、记忆、执行和反馈能力,从而真正进入人的工作和生活流程。
也正是在这个阶段,“智能体”从一个技术社区里的概念,逐渐成为AI产品的核心形态。
第三阶段,是2025年至2026年的“人人都是开发者”和“超级个体”。
当自然语言成为新的编程语言,开发应用不再只是程序员的专属能力。一个普通人只要能描述需求,就有机会把想法变成产品、服务甚至生意。
这件事的意义被低估了。过去,一个人想做一个软件,需要产品经理、设计师、前端、后端、测试、运营一起配合。今天,一个普通人可以用自然语言生成应用、改功能、上线、推广,甚至围绕应用完成商业闭环。
在Create 2026的素材里,有一个很有代表性的案例:来自温州的8岁小学生扑满,用秒哒做了一个“哒哒打伞”小程序。

这个想法来自校园生活:下雨放学时,没带伞的同学在走廊上喊“我要哒哒打伞”,带伞的同学接单,大家拼伞出校门。但问题是,一个班级的喊声传不到全校。于是,他想做一个全校版的“哒哒打伞”。
他不会写代码,就用自然语言告诉秒哒玩法和需求。最终,小程序支持“我想搭伞”和“我来打伞”,还能选择时间、起点、终点,支持独立打伞或拼伞,并通过积分升级激励更多同学参与。

这不是一个宏大的商业故事,却非常说明问题:开发正在从专业技能,变成表达能力。
秒哒的其他案例则更商业化。比如用户贺涛不懂编程,用秒哒做测评应用,跑通“想法—应用—变现—教学”的闭环;孙昱团队借助秒哒搭建智慧养老服务综合监管系统,单人7天搭建整套系统,4名无代码基础的业务项目经理可以1天出原型、半月交付,并已为超9万老人建立动态健康档案。
这些案例共同指向一个变化:AI不只是给大公司提效,也在放大普通个体和小团队的生产力。
所以,到了Create 2026,当李彦宏提出DAA,它其实并不是孤立的概念,而是前面三年判断的结果:
既然要“卷应用”,就必须衡量应用是否真正产生价值;既然智能体是主流形态,就必须衡量有多少智能体在真实运行;既然人人都是开发者、人人都是超级个体,就必须让每个人都能创造和使用Agent;既然企业会变成人与智能体的混合编队,就必须用新的指标衡量组织里的“数字员工”规模和活跃度。
这条线索是连贯的。它从“不要只卷模型”,走到“Agent会成为主流”,再走到“自然语言开发应用”,最后落到“DAA是AI时代的度量衡”。
在科技行业,真正稀缺的不是提出一个热词,而是连续几年在非共识阶段坚持同一套判断,并且不断用产品、基础设施和场景去验证它。
从这个角度看,李彦宏过去三年的AI判断,正在形成一个不断被现实验证的认知体系。
3、百度开始全面Agent化
如果说DAA是百度对AI时代价值衡量方式的判断,那么Create 2026上的产品发布,则显示出另一个趋势:百度的产品线正在全面向Agent迈进。
最典型的是DuMate。
DuMate是百度推出的通用智能体。它能看见屏幕、操作软件、处理文件、串联业务系统,用户只需要一句话,它就能从“想法”走向“结果”。
这和传统聊天机器人有本质区别。聊天机器人主要负责回答问题。用户问一句,它答一句。即便回答再准确,也还停留在“建议”层面。DuMate则更接近一个数字员工。它不只是告诉你应该怎么做,而是直接去做。
在Create 2026上我们看到,一个电商服装品牌创始人同时面对三项工作:处理未读邮件、分析销售数据并给出备货建议、生成新商品海报和公众号预热内容。

传统情况下,这至少对应客服、销售运营、市场营销三个岗位。DuMate的做法是三条任务线并行执行。工具是人来调度工具。Agent是人提出目标,智能体调度工具。
DuMate背后内置百度搜索、秒哒、伐谋、百科等Skill,还支持把标准化执行过程沉淀为Skill,并通过日报式反思持续进化。它真正指向的是一种新的工作形态:不是一个AI助手围着人转,而是一批数字员工围绕目标协同工作。
![]()
秒哒则对应另一个层面:让更多人创造Agent和应用。
Create 2026上,秒哒发布3.0,上线企业版,支持生成App,推出秒哒App,并扩展通用Agent和自定义Skill能力。它试图降低开发门槛,让用户通过自然语言生成iOS与Android应用,完成从开发、调试到发布的全流程。
如果DuMate解决的是“让Agent替人干活”,秒哒解决的就是“让人创造更多Agent和应用”。
这两者结合起来,才有可能形成DAA的增长基础。因为未来100亿个日活智能体,不可能只来自少数大厂,而必须来自大量普通人、开发者、小企业和行业客户的持续创造。
百度一镜则代表数字人产品进入多Agent协作阶段。
它从原来的直播带货数字人,升级为全场景数字人平台,覆盖直播、视频、实时互动、电商带货、广告营销、内容创作、影视剧集、服务培训等场景。
关键变化也不是“数字人更像人”这么简单,而是它背后有多Agent协作。
在视频创作中,一镜可以调度剧本Agent、视频Agent、剪辑Agent等完成端到端内容生产;在直播场景中,它可以调度主播、助播、场控、运营等多个专家智能体,完成复杂任务。
比如在帕梅拉蛋白能量棒带货视频案例中,一镜不仅生成了形象一致的数字人,还围绕健身博主的人设设计剧情:一个极度自律的人被“抓包”偷吃披萨,再自然引出蛋白棒作为“解馋、回血、无负担”的替代方案。它不是简单读参数,而是把卖点放进故事里。
这说明AI内容生产也正在从单点生成,变成多个专业Agent协同完成。
伐谋则更偏向企业决策Agent。
在Create 2026上,伐谋2.0被定义为直接面向业务专家的全局最优决策工具,不再只是技术人员使用的算法优化工具。它的核心价值在于:企业不需要一开始就把所有业务规则完整建模,而是在使用过程中,让业务专家不断指出方案与现实的偏差,系统持续理解、调整和优化。
这对制造、物流、工艺、金融风控等场景非常关键。
因为很多企业真正的壁垒,并不写在流程文档里,而藏在老师傅、调度员、风控专家、工程师多年积累的隐性经验中。传统软件很难把这些经验一次性结构化,而Agent可以在持续交互和推演中逐步沉淀。
青岛港案例很典型。码头调度是典型的多目标优化问题,每个目标都不能差,很多权衡需要把多个方案摆在业务专家面前才能判断。引入伐谋后,A-TOS自动化码头智能管控系统在实际生产环境中持续寻找更优调度方案,核心指标进一步提升9.91%。这已经不是“AI做辅助分析”,而是AI参与企业决策链条。
这就是Create 2026释放出的重要信号:百度不是在做几个孤立的AI应用,而是在把整个产品体系Agent化。
4、如何支撑百亿DAA?百度的新全栈AI云与“芯”动力
如果未来DAA真的走向百亿级,最大的问题不是概念是否成立,而是成本是否成立。
一个聊天机器人每天响应几轮对话,和一个Agent每天执行长链路任务,是完全不同的算力消耗。
智能体要完成任务,往往需要规划、拆解、调用工具、读取文件、访问系统、处理上下文、反复判断、纠错和复盘。一次任务可能包含几十步、上百步推理,也可能持续数小时甚至数天。这意味着,智能体时代对基础设施的要求远高于聊天机器人时代。
如果每一次Agent执行都伴随大量重复计算、上下文膨胀和推理成本飙升,那么DAA的繁荣就会停留在演示和少数高价值场景里,很难规模化。
所以,Create 2026上百度智能云提出“新需求,新供给,新全栈”,其背后的逻辑非常清楚:当客户需要的从计算、存储、网络,变成高活跃、高价值、规模化的智能体应用,云服务也必须重新定义。
![]()
过去的云,主要卖资源。智能体时代的AI云,必须卖“能让Agent稳定运行、持续进化、安全可控的基础设施”。
百度把这套能力拆成两层:Agent Infra和AI Infra。
Agent Infra解决的是智能体怎么开发、怎么运行、怎么管理的问题。比如Agent Harness提供长上下文管理、记忆、Sub-agent调度和评估能力,帮助开发者快速构建能完成复杂长程任务的智能体;内置Office、浏览器等Skills,让Agent具备跨生态执行能力;Agent Runtime则提供稳定、安全、可观测的运行环境,让Agent不只停留在Demo里,而是能进入企业生产系统。
AI Infra解决的是算力和效率问题。在长链路任务中,模型上下文会随着轮次增加迅速膨胀,动辄达到百万Tokens。但其中大量内容其实是已经计算过的上下文,如果每一轮都重新加载、重新计算,成本会非常高。百度智能云用Agent-first理念重构模型服务,通过长上下文和Cache管理,让Agent复用上下文、减少重复计算。这件事的意义不亚于移动互联网时代的云原生基础设施。
因为DAA的核心不是让一个Agent偶尔工作,而是让大量Agent每天稳定工作。只有当单位Token产生更高业务价值、单位算力支撑更多任务闭环,DAA才可能真正成为产业指标。
![]()
这也是“芯云模体”全栈能力的重要性所在。
在“芯”层面,百度昆仑芯P800已经在大模型训练和推理场景中完成规模化验证,并在互联网、金融、制造、教育、能源等行业实现超万片级交付。Create 2026上,百度还提到256卡昆仑芯版本已在上个月点亮,将在6月正式上市,可将模型推理效率提升50%。
在“云”层面,百度智能云强调面向Agent的基础设施重构。例如,义乌“前店后厂”企业用一见视觉智能体搭建AI厂长。过去厂长要针对不同问题训练模型,再把识别规则和处置流程逐个配置到摄像头。现在,商家可以用自然语言把工厂特定的产线标准交给一见,视觉智能体就能快速学习管理要求,并接管多个摄像头,完成安全隐患、设备异常、人员违规等巡检任务。
在“模”层面,5月9日,百度正式发布新一代基础大模型文心大模型5.1。该模型采用“多维弹性预训练”技术,仅以业界同规模模型约6% 的预训练成本,达到基础效果领先水平,登上 LMArena 搜索榜国内第一、全球第四,是唯一上榜的国产模型。在多项业界权威基准测试中,文心5.1在智能体、知识、推理和深度搜索等方面表现出色,其中Agent 能力提升较为明显,超越了 DeepSeek-V4-Pro。此外,其创意写作能力与 Gemini 3.1 Pro 相当,推理能力也已接近业界领先闭源模型。
在空间智能领域,百度地图也拿出了面向智能体时代的具体方案。本次大会,百度地图将正式发布整车AI座舱智能体平台DuDuClaw“嘟嘟虾”,向车企开放底层能力;同时推出百度地图CLI工具以及国内首家发布的地图开发智能体MAPYA,支持自然语言生成代码与AI调用。截至目前,百度地图已服务超400万开发者,其AI副驾也在今年五一期间累计服务超2亿人次。
这些案例共同证明一点:DAA不是消费互联网里的“活跃用户”概念,而是生产系统里的“活跃智能体”概念。
它需要模型、云、芯片、工具、运行环境、行业知识和安全体系共同支撑。没有全栈能力,DAA很容易沦为空洞口号;有了全栈能力,它才可能变成可增长、可运营、可商业化的真实指标。
5、真正的机会,常常藏在非共识之中
AI行业变化太快,快到很多共识的保质期都很短。
昨天所有人还在讨论大模型参数,今天已经开始讨论Agent落地;昨天所有人还在寻找超级App,今天越来越多行业开始接受“智能体编队”;昨天Token消耗还被当作繁荣象征,今天大家已经意识到,Token首先是成本,只有转化为结果才有意义。
越是在这样的周期里,越需要有人回到技术和商业的本质,提出那些不一定顺耳、但可能更接近长期趋势的判断。因为在AI这样高速迭代的时代,共识往往意味着窗口正在关闭,而真正的机会,常常藏在非共识之中。
Create 2026之后,DAA或许也会经历一个从被讨论、被质疑到被验证的过程。它可能还需要更清晰的统计口径、更广泛的行业参与、更真实的商业案例来支撑。但至少,它把AI行业带回了一个值得讨论的问题:我们到底应该用什么来衡量AI的价值?
