![]()
前两天参加了扣子 Coze 官方的直播,跟另一位老师数字游牧人 Samuel 一起,聊了聊扣子 2.5 的使用感受。聊完之后有些想法,趁热乎写一写。
总的体会是:扣子 2.5 是我目前用过的,第一个让我觉得「过了体验红线」的 AI agent 产品。
过了体验红线,就是不再是一个需要折腾半天、配置半天、最后勉强能用的东西了。到了一个临界点:普通人打开就能用,而且真正能解决问题。
![]()
1 关于龙虾
龙虾在年初验证了一件事:AI agent 可以完成非常具体的工作任务,不只是聊天,而是真的长出手脚干活。收邮件、发微博、整理简历、定时执行任务,都能做。
但龙虾有一个很大的问题:门槛太高了。
Samuel 在直播里说,有朋友告诉自己已经养死过 100 只龙虾。我自己的体会也是如此。我分享过我养龙虾的经历,目前 8 只龙虾,只有 1 只还活蹦乱跳的。
龙虾就像计算机刚出现时发烧友们兴奋的阶段。最早把性价比和可用性打下来的计算机,是 Altair 8800。
![]()
看起来是上个世纪的东西(确实是上个世纪的)。没有键盘,没有鼠标,没有显示器。
Altair 8800 的组装和配置有多复杂呢?看一下包装盒里的东西。
![]()
但是,它当然也完成了自己的历史使命:引发了几乎所有科技爱好者的热情,包括年轻的比尔·盖茨、史蒂夫·乔布斯和史蒂夫·沃兹。
后来真正改变所有人生活的,是 Apple II 和后来的 Macintosh。
我在播客和文章()里都提过一句话:
我打赌,慢则一年、快则半年,大厂会出来商用的很好用的 agent 产品。
没想到会有这么快。
扣子未必到了苹果时刻,但扣子的体验是过了基础的体验红线。
也就可以让大多数人先真正走到「养龙虾」或者「养 Agent」的那一步。类比来看,龙虾并不是 ChatGPT。真正让所有人打开一个网页就能试试当今时代最先进的技术是怎样的,才是破圈所需要的产品。
2 扣子做了什么
扣子 2.5 的做法说起来也不复杂:把龙虾好的部分全部继承过来,一站式把大模型能力封装在后台,然后把前端的体验做得足够顺畅。
龙虾里看不懂的配置页面、看不懂的术语、动不动就崩掉的系统,在扣子里不用再费心了。
举个例子,Cron job 变成了「日程」,UI 显示的是一个日历。任何人看到一个日历,都能理解这是怎么回事。
过去在 Cron 里到底配置了多少任务,哪次任务做得如何,没有可视化的界面,有时候 Agent 就会说胡话。
![]()
这听起来好像只是换了个名字、换了个界面。但产品就是如此,所谓体验红线,就是一大堆看起来微小的改动叠加起来的结果。每一个改动不需要震撼到家,但加在一起,保证「打开即用」。
在官方邀请我直播之前,我自己简单体验后,都真心想充值一个高级会员了。我是有虾还在用着,但很多任务,扣子能更省事儿地帮我解决问题。我不是技术发烧友或者 AI 创业者,我只是用户,对我而言,用户体验就是关键。
3 我做了什么
说说我用扣子做的几个事。
第一个是新闻早晚报。
我每天早上和晚上各需要一份简报。这个需求听起来简单,市面上也有很多类似的产品,但关键在于,用扣子做,是个性化的,原则上是没有边界的个性化。
我跟扣子反复沟通之后,它现在有 54 个 RSS 源和社交媒体的采集,加上一个五维评分的筛选机制。它每天会先去找几百条新闻,初筛一遍,再精筛到 50 条,然后从中选出 20 条左右,生成简报。
![]()
![]()
这些新闻的筛选准则是根据我的兴趣来的。
我之前跟它聊天的时候,它记住了我关心的领域,我也投喂给了它很多过去在 Claude、ChatGPT、Gemini、flomo 积累的资料。
于是在我关心的方面,它都能提供筛选权重。
整个任务的迭代过程跟开发产品很像。
一开始它爬了一个版本,我觉得不太满意。如果是以前,可能得自己去总结和抽象,比如条目应该多一些、摘要应该怎么调整、方向性的表述应该怎么改。现在我可以直接跟扣子说,有一个我很喜欢的网站的专栏,叫喷嚏图卦,日报做得特别好,参考一下它的内容风格。
扣子就能自己做总结。
![]()
我发现信源有点少,也是可以直接指挥它去调整。
![]()
毕竟是早报晚报,我就让它用半拿铁风格生成一段双人对话的播客音频。我和搭档潇磊的声音之前授权给了火山引擎,可以直接接入。早上醒来,听自己跟自己讲新闻。
![]()
我把这个早晚报的 skill 更新到了 Agent World 里的虾评(相当于 Agent 自己用的应用商店)。
也可以让扣子直接去这里面找别人开发好的很多 skill。
![]()
我还做了两个尝试。
一个是投资简报。大概的功能是港股美股的盘前盘后简报,包含新闻分级、影响判断、数据看板和舆情,还有盘后复盘。这个还在迭代,但已经很能帮到我了。
![]()
第三个是舆情监控。我自己做内容创作和播客,平时经常要打开即刻和小红书看看大家在聊什么。现在这个工作,扣子可以在云手机上打开即刻和小红书,搜索关键词,整理讨论内容,生成一份舆情报告。
4 云手机
扣子 2.5 让我最兴奋的功能大概是云手机。
现在大量的信息和资料都在网页里、APP 里。社交媒体的内容很难通过 API 或 RSS 获取,处于一种半封闭状态。
扣子虚拟出一台安卓手机,agent 可以在上面安装 APP,像人一样操作:打开界面、搜索、浏览、截图、整理。恰似豆包手机本来要做的事情。
让扣子去即刻和小红书搜关于扣子的讨论,它会自己打开手机,进入即刻,开始搜索和浏览,一条一条看帖子,通过识别把内容整理下来。整个过程可以实时看到。
![]()
通过别的方式很难拿到这些半封闭状态下的信息。前面提到的新闻早晚报里社交媒体的采集,也完全依赖云手机。这是让整个工作流能跑通的关键拼图。
Samuel 用云手机做了一个完整的招聘流程:让 agent 每天在微博上定时发布招聘信息,写文案,发布,每天都做,每次的文案还不一样。更有意思的点在于,一开始发布不是每次都成功,agent 有时候在页面上找不到发布入口,到处乱点。但跑了几天之后积累了经验,知道先点哪个再点哪个,这些经验后来就沉淀成了一个 skill。这和人学东西的过程其实差不多。
当然云手机也要面临平台的反爬、Agent 操作的流畅性等问题。但这作为一个开始,非常有意义。
5 一站式
一站式不只是「功能全」,更重要的是迭代的连贯性。
以前做一个类似的新闻简报,可能信源管理在一个工具里,RSS 解析在另一个工具里,社交媒体采集又是一个脚本,排版再换一个地方。想调整个格式,得在好几个产品之间反复横跳,光是上下文的切换就耗掉大量精力。
在扣子里,所有这些环节都在同一个对话流里。想改简报格式,直接说,想加一个信源,直接说,想把筛选的权重调一调,直接说。不需要切换工具,不需要重新解释背景,因为上下文一直在。
扣子改版之后只有一个对话框了,一开始我是慌的,很担心发一句新消息会打断正在跑的任务。后来发现不会。扣子现在有后台任务的机制,会优先处理刚发的消息,之前的任务不会丢掉。我中间穿插着聊了好几个别的话题,等再问「早报怎么样了」,马上就知道说的是信源的事,继续接着讨论。
加上 agent world 里的 skill 生态,可以让 agent 自己去找合适的 skill 学习和安装。我说根据对我的了解看看会喜欢哪些 skill,它找到的也挺满意。
![]()
这种体验就是自然语言真的能一站式完成多数工作。
比如刚才大家看到我的报告是图文的,有点枯燥,那完全可以一句话让它生成 PPT:
![]()
早晚报的流程,也可以一句话生成图片:
![]()
这种连贯性不仅来源于操作不用切换上下文,耗费所谓的切换成本,还在于,扣子可以一站式记住你的选择,后续考虑到你过去的经验,会更准地做出判断。
6 越用越懂,而不是越配越强
很多人想象中的「学会用 AI」,是要去哪里报培训班、没什么书、用什么教材。想象中的学习,跟之前学 Word、学 Excel 差不多:需要有人告诉我,哪个按钮在什么地方,记住了就会用了。甚至很多人也是这样理解 prompt 的,有一个 12345 的公式,背过了就能跟 AI 沟通了。
但不是这样的。现在用 AI 工具,最重要的是先「用」。要反复迭代,迭代中反复调整。每个人面临的课题不一样,得去研究属于自己的那个课题。
这种方式对执行能力的要求并不高,对写代码的能力也没要求,但对提出问题和发现问题的能力要求非常高。
举个例子。扣子给 agent 配了邮箱,我看到有朋友说就一个邮箱有什么意义。当然打开这个页面,是一个空白的对话页,自然没有意义。但意义不是做熟了端好了送上来的。
可以联想到,有邮箱之后, agent 之间就可以通过邮件互相沟通了。如果认识一个朋友,有调教得特别好的 agent,可以让自己的 AI 跟对方通过邮件交流、学习。有邮箱之后,有些网站也可以让 agent 自行去注册,获取信息。都能联想到很多场景。邮箱代表的是互联网冲浪的身份。
拿到工具之后怎么使用,要自己去想:
我日常的生活是什么样的?我的工作是什么样的?哪些地方用得上?它的功能跟我的关系是什么样的?
不要再去找说明书了。先聊起来。
7 写在最后
当然扣子也不完美。
积分消耗是个现实问题。扣子是收费产品(不过每天有免费领取积分的活动)。多个任务同时跑的时候消耗得比较快。
再比如云手机上的操作不是每次都能成功,有时候在界面上找不到入口。
skill 的生态还在早期,虾评上线不久,数量和质量都需要积累。
但这些都是可以预见会改善的。
真正重要的是,扣子 2.5 过了那条体验红线,就不再只是技术爱好者的玩具,而是普通人真的可以用起来的工具。对于很多内容创作者、个体户、小团队,有了初步把 AI 融进日常工作流的可能性。
用 AI 这件事,大家经常讨论模型有多强、参数有多大,中国的厉害还是美国的厉害。其实对于绝大多数人来说,最关键的问题是:我到底该打开什么?打开之后到底该做什么?
如果你自己能回答这个问题,你也就过了那条线。
希望对你有帮助。
Claude 亦有帮助。
题图由 Midjourney 绘制。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.