![]()
1 为什么要关注百度文库和百度网盘的 Agent?
8 月 18 日,在百度的 AI Day 上,百度文库、百度网盘联合发布了一个全端通用 Agent「GenFlow2.0」。
各位可能觉得,目前的 AI Agent 够多了,再聊一个,又能有什么差别?
其实我之前就写过百度文库和百度网盘做的 AI 新功能。在当前阶段,Agent 卷的方向已经不是技术壁垒或者实现速度,而是数据和场景。
而百度文库的大量真正实用的、有效的文档内容,以及百度网盘大量的个人用户授权后的信息和资料,就构成了用它们基础上的 Agent 最有差异的地方。
先说几个简要的不同。
第一,文库 GenFlow 2.0 Web 端和 APP 全端可用,不需要邀请码,也不用排队,当下就全部开放使用,真正全现货提供使用。这也是大厂做 Agent 的一种底气了。
第二,采用众多 Agent 专家协助。官方称有 100 个文库、网盘里数亿用户验证的专家 Agent 同时在干活,可以 3 分钟并行完成 5-6 个复杂任务,并且是 同行速度 5-10 倍。
这点我没有做大量统计意义上的测试,但个人感受,的确用 GenFlow 2.0 会非常高效,有时候不用走开很久,而是看着界面等结果就能等到。这点后面再说。
第三,也是最关键的。GenFlow 2.0 可以背靠文库和网盘,利用好它们的数据资源。
对于文库而言,可以检索文库等公域数据库上海量的专业内容。这个是百度文库独有的优势,文库的产品定位决定了这里面的数据和资料都是经过用户筛选的、有价值的。比如目前还打通了百度学术上超 6.8 亿的学术文献,内容生成有专业性和权威性。同时,也可以调用个人网盘的数据信息(在用户允许的前提下)。这样就能提供差异化的结果。
我们知道,目前 AI 的模型推理水平已经到了增长缓慢的阶段,建立数据壁垒、场景壁垒乃至用户壁垒成了兵家必争之地。这是值得多关注一下 GenFlow 2.0 的原因。
2 实测案例
这里提供几个实测的案例,供各位参考。
2.1 梦幻西游里的经济框架研究
还是先做一个跟文库相关的尝试,这是 Prompt:梦幻西游里的经济框架研究。是我前阵子做过的半拿铁选题里的一个课题。

可以看到,这里分了几个步骤。
首先,做了任务规划:
![]()
接下来,搜集了百度文库里的相关文档,就我的了解而言,这些文档的质量都是不错的:
![]()
再接下来,则是调用了「研究专家」来进行研究,
![]()
拆分了活活有 5 个大主题,每个主题下都有 2-3 个子话题。
接下来,调用的则是「研报专家」,来进行具体内容的撰写:
![]()
最终生成了一份 41 页的文档。
![]()
不得不说,文档的封面还是挺好看的。而且注意左下角能看到字数的,一共接近 3 万字的报告,就这么得到了。
内容十分详尽,包括了几乎所有在梦幻西游内容的经济系统相关的元素,以及具体的解释。有的内容有对比的价值的,还会生成表格供参考。比如:
![]()
而且,更惊艳的在于,我可以继续给 GenFlow 追加任务。比如可以生成一份 PPT。半分钟的工夫,就得到了这个:
![]()
看目录的覆盖面,是真的把文档的内容又都提取出来做了蒸馏了:
![]()
这个 PPT 的背景也比我用过的好些个 AI PPT 的工具要好看多了。
从刚刚这个案例,也能看得出,百度文库对 GenFlow 2.0 的加持效果。一个是文档的内容,另外还有,相当多的 PPT 模板库带来的对 PPT 的呈现的优化帮助。
当然,也不仅仅是文库相关的 Agent 任务有这样好的效果。我尝试了一下其它的几个案例,也很有意思。
2.2 书籍研究
我把百度的一本创业历史的书籍投喂给 GenFlow,让他帮忙整理核心的事件,并做成 PPT。
![]()
这次调用的则是「文档分析师」:
![]()
再通过 「PPT 大师」的创作:
![]()
很快就得到了这样的结果:
![]()
![]()
对于要把一本书讲给别人,或者自己整理一份读书笔记的场景来说,效果就相当好。
再说一遍感受,PPT 的模板很不错,没有排版混乱。做一下简单的调整,就能拿来用了。
2.3 小游戏
有的朋友可能会问,是不是 GenFlow 主要适合做资料搜集和整理。还真不是,我用它做一些常规 Agent 都能完成的任务,意外地发现它的效果并不差,甚至相当好。
比如:
![]()
这次调用的是「代码高手」:
![]()
然后就得到了这样一个游戏:

这里面有分数和关卡的设定,还采用了 3 条命的常见游戏设定(这点很棒)。游戏的玩法机制没有任何问题。
可是这次设计,不知是不是 AI 认为移动端是主流,交互做成了摇杆加按钮的,键盘无法操作,需要鼠标去拖动摇杆、点击按钮。
于是我让 GenFlow 改一下,也是简单的一句话:
![]()
很快,代码高手又上线了。这次输出的是这样的:

这次相当简洁,下方就展示了可以用到的三个按键:左右移动,上是射击。但按空格键也是射击。这种小细节都非常意外。属于不需要一点点告诉 GenFlow,而是它自己就多想了好几步,给帮忙想好了。
2.4 手办设计
还有一个案例我很喜欢,是做手办设计。
![]()
看 GenFlow 做的任务规划,也是每个步骤都很清晰:
![]()
确认了设计的四个对象之后,开始在网上搜集信息:
![]()
接下来,就是见证奇迹的时刻:
![]()
![]()
手办的质感很超出我的想象,阴影和细节效果非常好。更重要的是作为同系列的盲盒,风格是一致的。
从资料搜集、到研究整理,再到生成 PPT,作图,以及做小游戏,文库 GenFlow 2.0 在多样化的场景下效果都有点超出预期。
还有一点,前面提到的,这中间的生成速度都挺快的,一般是几分钟的量级,慢的也就十几分钟。而之前体验的很多 Agent,是需要几十分钟甚至几个小时的。
3 最后说几句
自从 AI Agent 变成今年 AI 热点后,Agent 算是层出不穷。有各式各样的探索 Agent 交互的、架构的以及体验的产品。
到最后,还是想说个简单的点,AI Agent 并不是完全不同的物种,重点不仅在于探索模型和协议,更不在于呈现多酷炫的界面、多有噱头的排版,而是简简单单的,好用且方便。
GenFlow 2.0 给我的感受很简单,就是几点:
现货,不需要邀请码。
多端,移动端和 Web 端都能用。
快速。几分钟且多任务,都能完成。
过程可干预,结果可修改。这样也不会浪费之前的时间和投入。
文库和网盘的内容,提供独有的数据资料。
在今天的 AI 大潮里,我们很容易被各种「颠覆」「革命」「替代」的词汇裹挟。但回到用户视角,真正重要的还是两个字:好用。
GenFlow 2.0 借助文库和网盘的独特数据资源,把 Agent 落到了能解决问题、节省时间、提升效率的具体场景中。无论是研究整理、知识提炼,还是创意生成、工具调用,它的表现都足够稳定和高效。
所以,当大家都还在争论 Agent 的定义和未来时,文库 GenFlow 2.0 给出了一个清晰的答案:稳定先行,数据为本,实在一点解决问题,完成交付。或许这才是 Agent 的内卷竞争里最值得关注的长期差异。
ChatGPT、Gemini 亦有帮助。
题图由 Midjourney 绘制。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.