2024年12月,真格基金的合伙人戴雨森体验完AI Agent产品Devin之后,发了这样一条朋友圈——
“Devin 作为第一个真正能用的真 · Agent 产品,它的出现可能标志着人类历史的一个重要时刻,500 美金可以买两瓶茅台,或者可以开一个 Devin 账号,提前体验未来。”
戴雨森后续在播客中这样解释道——
“在人类历史上,所有事情基本都需要人的 Attention, AI 技术的进步带来了一种,第一不需要人类的注意力,第二又能自主执行任务的可能,不夸张地说,这是人类诞生以来最大的进步,在 Agent 时代,「Attention is not all you need」”
戴雨森的判断或许是一种略带夸张的“暴论”。
但毫无疑问,AI Agent的确是让AI从“能回答问题”进化到了“能自主干活”的阶段,因而让它的实用性跨越了一大步。
2025年被称之为“Agent之年”,今天我们不聊主打海外市场的Manus、Genspark等Agent产品。
而是一起来看一看一款国产AI Agent产品——文库Genflow2.0。
看一看它能带来哪些有意思的玩法:
一、从一个有意思的脑洞开始
作为科技博主,我个人非常喜欢用AI开脑洞。
比如之前就专门用让Claude用《华尔街日报》的风格报道,或者让DeepSeek写。
AI在这类任务上的表现往往会超出预期,而我也能收获诸多切实的愉悦。
同样,今天我们也用Genflow2.0来开脑洞,看一看这个全端通用Agent到底表现如何。
废话少说,开始我们今天的第一个小的脑洞:
我在GenFlow的输入框中输入了以下这个极其简洁的任务——
“请根据《甄嬛传》设计一款桌游。”
下面是它大概5分钟之后的产出——
可以看到,GenFlow接到需求后,展现了清晰的问题分解能力和策略,先将需求拆解为5个子任务——
信息收集→机制设计→规则编写→组件设计→原型生成。
清晰、准确,不拖泥带水。
在收集《甄嬛传》素材时,GenFlow明确了检索重点:剧情梗概、人物关系、宫斗桥段、宫廷等级制度。
搜索结果涵盖了百度百科、知乎专栏等多种信息源,找的的确都是核心信息。
在搜集资料完成后,GenFlow进行了规划,根据不同阶段需求智能选择了多种工具来实现目标:
用"脑图思想家"将散乱信息结构化,生成XMind思维导图
用"文档小能手"输出机制设计方案和规则说明书两个Word文档
用"图表专家"绘制组件架构图,理清各元素关系
用"灵魂画手"设计角色卡牌和事件卡牌的视觉效果
用"代码高手"创建可交互的HTML原型
在输出层面,Agent生成了6种不同形态的成果物:思维导图(信息梳理)、Word文档(方案规则)、PNG架构图(组件关系)、卡牌图片(视觉设计)、HTML原型(交互体验)。
每种输出都有明确功能定位,形成了从抽象到具体的完整产品体系。
Genflow《甄嬛传》桌游交付的多种形态
注意,我并没有在需求中要求它输出什么形态,而是Genflow根据自己的理解。
很显然,它认为一个桌游,如果有多维度的交付物,在完整度上会加分,这一点的确表现不错。
从最终产出看,Agent准确把握了桌游设计的核心要素:有多阵营角色扮演机制、有宫斗策略系统、有经典剧情事件。
体现了《甄嬛传》的IP特色,非常老司机。
二、GenFlow到底有哪些值得强调的特点?
以上这个任务尽管很简洁,但它是GenFlow作为一个聪明、专业、快速的Agent的一个缩影,它其实已经体现了GenFlow几个重要特征——
1.多智能体规划调度
依托于自研的Multi-Agent基础架构,GenFlow支持100+ Agent专家团同时干活,根据逻辑自主规划串行还是并行;
2.强大的检索能力
搜索Agent自行在全网深度检索并反思、整理检索结果,懂你所想;
3.速度快
在几分钟可并行完成5-6个以上复杂任务,速度是同类产品的5-10倍;
而除了以上这些核心特征,事实上GenFlow还有很多值得关注的特点和细节,咱们继续通过一些有意思的脑洞来看一看:
1.“请分析一下《西游记》师徒四人的MBTI并输出PPT”
可以看到,面对这个带有调侃的任务,GenFlow进行了严肃的分析和规划,在执行时,它是这样思考的——
根据任务规划,当前需要先完成第一步"师徒四人MBTI信息收集",考虑到MBTI分析属于心理学专业领域,且需要系统性信息搜集,最适合使用“研究专家”进行深度检索。
我很喜欢这个“研究专家”这个智能体,它其实就相当于AI行业内的DeepResearch的功能。
它可以对目标问题进行非常详细的搜索和研究,而且是边搜索边思考边研究。
因此,其输出的广度和深度都要比普通的联网搜索效果要好。
我看了以下它的研究过程,近万字的搜索与思考,最终只为了输出以下制作成表格的精简结论——
GenFlow另一点做的非常好的是,其输出的交付,无论什么格式,都支持在线编辑和修改。
比如这个PPT,我随时都可以点击进行任何细节的修改,这一点值得点赞。
2.“请参考这张图的美术风格和语言风格做一个犀利的骂醒网页,督促大学生滚回去学习”
这是一个有点中二的任务,图片风格和语言都挺中二的,看一看GenFlow表现如何——
可以看到,GenFlow非常准确地get到了图片的语言风格和美术风格。
这其实得益于GenFlow有非常好的多模态理解能力,其“图片分析师”的工作很到位,抽象了图片中配色和文字中二的本色,因而让生成效果超出预期。
这个网页很有意思,它有很多细节,比如每隔30秒会刷新毒鸡汤,而按钮都是支持点击的。
同时这个网页是已经部署好了的,我试了一下,它居然是响应式设计。
即无论你是移动端打开还是Web端打开,它的渲染都是兼容的。
而且
“你已经浪费了XX小时XX分钟”的字样 都是动态的,我在它的注释中还看到了
“每30秒换一下背景以增强压迫感”。
从这些细节中,可以看到它对需求的理解相当到位。
我把网页的链接放在了文末“阅读原文”的链接中,我的读者中如果有需要的大学生童鞋可自取,不谢!
3.“蒙娜丽莎和兵马俑恋爱了,请为他们设计四款手办”
可以看到,GenFlow立刻开始规划并执行,注意,这时候我们是可以随时添加补充的。
我加入了以下补充——
“请给他们写一个简单的爱情故事”,GenFlow立马显示了追问并且开始了重新规划。
事实上,GenFlow任务执行中可随时暂停、打断、在思考过程中,用户可以随时暂停、追问、补充要求、甚至修改思考内容。
用户还能随时调用更多个人文件,中间文件也可以直接编辑,把生成后干预进一步前置到了生成中干预。
同时,在生成手办的过程中,我们看到GenFlow是四张图并行开始生成,速度非常快。
移动端更能直观看到每个智能体的分工与进度,而GenFlow这种既支持Web端也支持移动端的设计的确让用户能在不同场景下灵活上手。
老实说,在移动端做复杂的Agent任务,我原本是不抱太大期望的,但GenFlow的移动端表现让人刮目相看。
它在手机端可视化也做的很好,用户可以清楚地看到每个智能体的工作状态,就像是一个任务管理器。
从前面几个案例可以看出,文库GenFlow2.0确实展现了不俗的实力。
不过,作为一个科技博主,光看几个有趣的案例当然是不够的,我们需要更深入地了解文库GenFlow2.0的核心竞争力。
三、冰山底下有什么——GenFlow背后的一些技术细节
我们看到的GenFlow吭哧吭哧看干活其实是冰山水面以上的部分,而要实现这些,更多的技术工程藏在水面以下。
和GenFlow的团队简单交流了以下,发现他们至少用到了动态混合推理、多模式智能调度、公私域知识增强、全模态理解和渲染、全周期消息总线、临短长记忆中枢、MCP server原生支持等普通用户云里雾里的技术和能力。
当然,作为大部分“吃鸡蛋”的普通用户而言,没必要去详细了解那只下蛋的“鸡”。
因此我个人只简单基于自己的理解重点说一下两点——
1. 多智能体并行架构和动态混合推理机制
与市面上很多"伪Agent"产品不同,GenFlow基于自研的Multi-Agent基础架构,实现了真正意义上的多智能体协同。
这就像是一个真正的项目团队——有人负责调研,有人负责设计,有人负责开发,可以灵活地并行和串行,而不是排队等着前一个人完成。
GenFlow采用了的"动态混合推理",通俗点说就是它会根据不同的任务类型和复杂度,智能选择最合适的模型和策略,像一个项目经理,知道什么样的任务应该派什么样的人去做。
比如,当我输入
"999的2次方等于多少"这样的简单问题时,GenFlow会直接给出答案,不会浪费资源调用复杂的流程。
但当我提出复杂的创作需求时,它就会启动完整的多智能体协作模式。
尽管GPT5上的“智能路由”遭到了用户的吐槽,但如果真正做好了简单和复杂的路由,实际体验上一定是会加分的。
2. 强大的记忆库系统
GenFlow有一个我认为非常有价值的功能——记忆库。
它可以记住用户的历史对话、文件使用情况、搜索偏好等信息,从而实现真正的个性化服务。
这意味着什么?
举个例子,如果你上个月GenFlow帮你处理学术论文相关的任务。
这个月你可以直接问它——
“上次关于mRNA的论文帮我输出成PPT演示版吧”
它就能直接沿着上次的任务扩展执行。
事实上,得益于生态上的打通,GenFlow可以记住并运用用户在文库网盘沟通的历史记录、上传下载文件,从而可以更好地无缝地处理任务。
这里分享一个我自己的小技巧,我的工作习惯是将要处理的文档一般都放在桌面或者桌面的文件夹里,而百度网盘有同步桌面的功能。
这意味着你的文件本身随时随地和网盘内容同步,因此可以随时呼叫GenFlow处理,免去了上传的麻烦,非常方便。
没错,从“Prompt engineering”到“Context engineering”,今天的AI更加注重长的、有用的上下文。
毕竟每一个用户的需求都是连续的,而不是碎片化的。
“带上眼镜,AI可以看到我每天看到的,每天听到的”理想型全上下文时代到来之前,我认为GenFlow这种先将网盘、文档、历史记录打通的Context模式是务实的、有用的。
回到文章开头戴雨森的那个判断,AI Agent确实代表了AI发展的一个重要方向。
从"能回答问题"到"能自主干活",的确是一个应用层面的质变。
从我的体验来看,GenFlow是一个值得国内用户尝试的AI Agent产品。
它不仅在技术架构上有创新,在产品体验上也做出了不少有价值的探索。
在AI Agent这个快速发展的赛道中,我们需要的不是另一个"会聊天的AI",而是真正能够帮助我们提升效率的智能助手。
从这个角度来看,GenFlow走在了正确的方向上。
当然,最终的判断还是要交给广大用户,Agent产品的价值,最终体现在它能否真正融入到我们的工作和生活中。
让AI真正走向实用,走向大众。
文库GenFlow2.0,会是那个答案吗?
我们拭目以待。
——End——
作者简介:卫夕,公众号“卫夕指北”出品人,科技专栏作者,专写长文,专注剖析互联网及社会科学的底层逻辑;不关注这个账号,你都不知道你会错过神马!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.