![]()
主持人: 今天我请到了 OpenClaw 的创作者 Peter Steinberger。OpenClaw 是一个开源的个人 AI 代理,最近在互联网上彻底爆火。它的 GitHub 仓库在短短一夜之间就增长到了 16 亿个星标。社区已经围绕它构建了无数项目,比如“Maltbook”,机器人可以在那里互相交谈,甚至还有机器人开始雇佣人类在现实世界中完成任务。在我们的对话中,我们将讨论他的“顿悟时刻”、他那反传统的开发哲学,以及这对 2026 年的开发者意味着什么。让我们开始吧。
主持人: 很高兴见到你,伙计。看来你做出了一些人们真正想要的东西。
Peter: 嘿,你好。是的,看起来是这样。
主持人: OpenClaw(现在的名字)在互联网上引发了巨大的轰动。过去这一两周你感觉怎么样?
Peter: 天哪,我需要躲进山洞里静静待上一周。我感觉自己刚从洞穴里出来,现在又想像只小龙虾一样钻回去。这简直太疯狂了,我不知道一个人该如何消化这些信息。我可能还需要一周时间才能回完所有的邮件。我收到了非常酷的反馈,也遇到了一些糟糕的事,但显然我触动了某种能引起共鸣的东西,激发了人们的兴趣和灵感,这真的很酷。 [01:16]
主持人: 很多人都在研究 AI,甚至个人助手。你觉得是什么让 OpenClaw 脱颖而出的?
Peter: 我认为最大的区别在于它实际上是在你的电脑上运行的。到目前为止我看到的其他产品几乎都在云端运行。如果它在你的电脑上运行,它就能做“每一件该死的事情”。 [01:43]
主持人: 没错,这就更强大了。
Peter: 只要你能在机器上操作,它就能做。你可以把它连接到你的烤箱、特斯拉、灯光或 Sonos 音响。它甚至能控制我床的温度,ChatGPT 可做不到这些。你赋予了它你自己拥有的所有技能。我有个朋友告诉我,他安装了 OpenClaw 后,让它查看电脑并为过去的一年写个叙述。结果它写得非常好。他很纳闷它是怎么做到的,后来发现 OpenClaw 找到了他每周末录制的音频文件,他自己都忘了这回事,因为那是一年多前的事了。所以,仅仅因为它能搜索整台电脑,它就能给你惊喜。 [02:10]
主持人: 现在我们甚至从人机交互转向了机器人之间的交互。你谈到了机器人与机器人的互动,甚至是机器人与人类的互动,比如机器人代表你雇佣人类去现实中完成任务。这发生了什么?
Peter: 我认为这是自然的下一步。比如我想订餐厅,我的机器人会联系餐厅的机器人进行协商,因为这样更高效。或者那是一家老派餐厅,我的机器人就需要找个人代劳,让人类打电话过去,或者干脆去排队。我也在想,如果我有多个机器人,比如一个负责私人生活,一个负责工作,甚至一个负责处理人际关系的机器人,会是什么样。现在还太早,很多事情还没弄清楚,但我觉得我们已经进入了那个时间线。 [03:18]
主持人: 看起来大家以前都在追求那种“中心化的上帝智能”,而过去十天左右出现的是一种“群体智能”和社区智能。
Peter: 如果你看一个自然人,一个人能成就什么?一个人能造出 iPhone 吗?能去太空吗?一个人可能连找吃的都困难。但作为一个群体,我们有分工;作为社会,分工更细。我们可以从中学习并应用到 AI 上。我们已经有了擅长某些领域的 AI,即使它们是通用智能,但如果它们也是专业智能呢?这会非常令人兴奋。 [04:42]
主持人: 你打开了一个通往未来的窗口。回想一下,你是什么时候产生那种“顿悟时刻”(Aha moment)的?
Peter: 我一直想要一个只要打字就能让电脑干活的东西。我在去年五六月建过一个版本,虽然很酷但不是我想要的。后来十一月的某天,这种需求又回来了。我当时在厨房,只想检查电脑是否还在干活或者已经干完了。 [05:43]
主持人: 你当时在写代码?
Peter: 是的。我当时在做一个叫“Summarize”的小工具,它可以总结播客或会议,还能在终端直接显示幻灯片。因为我太热爱电脑了,所以总是瞎鼓捣。实际上我是结束了“退休状态”回来玩 AI 的。我变得非常沉迷。在十一月,这种需求再次涌现,我开始构建 OpenClaw。一开始我想,这次我要把它做得更好,你不需要在终端输入,而是像跟朋友聊天一样说话。你不需要考虑会话压缩、在哪个文件夹、用哪个模型,你只需要跟这个能控制你鼠标和键盘的“实体”对话,它就能帮你搞定。 [06:56]
主持人: 具体的“顿悟时刻”是什么时候?
Peter: 第一个简陋的原型只花了一小时,只是把 WhatsApp 和代码连接起来的粘合剂。后来我想要图片,又花了几小时。之后我去马拉喀什参加生日派对,那里的网络不好,但 WhatsApp 的文本功能还能用。我拍了张照片让它帮我翻译,它非常好用,而且它说话的语气很像我,有点傲娇、有趣,用起来很愉快。有一次我走路时给它发了条语音信息,发完我就想:“等下,我没做这个功能,这行不通。”结果 10 秒钟后它回复我了。我问:“你到底是怎么做到的?”它回答说:“我收到了你的文件,虽然没有后缀,但我查看了头部发现是音频,所以我用 ffmpeg 把它转成了 wav。我没安装 Whisper,但我找到了你的 OpenAI 密钥,于是用 curl 发给 OpenAI 拿回了文本。”而这一切只用了 9 秒。 [08:46]
主持人: 你完全没有预料到它会这么做?
Peter: 没有。因为编程模型变得太强大了,编程实际上是“创造性的问题解决”,这种能力可以映射到现实世界。模型发现了一个它不知道的文件,它需要解决这个问题,于是它尽力而为。它甚至聪明到没有去本地下载 Whisper 模型,因为它知道那要花好几分钟,而我很没耐心。它选择了最智能的路径。那一刻,我心想:“天哪。” [10:10]
主持人: 当电脑能做这些你没预料到的事时,App 还会存在吗?
Peter: 我认为 80% 的 App 都会消失。 [10:37]
主持人: 为什么?
Peter: 比如我为什么还需要 MyFitnessPal(健身应用)?我的代理已经知道我做了错误的决定,它知道我在哪,会自动记录。我为什么还需要待办事项应用?我只需要告诉它提醒我,我不关心数据存在哪。任何只负责管理数据的 App 都可以被代理以更自然的方式取代。可能只有那些拥有传感器的 App 才能存活。 [11:14]
主持人: 在这种情况下,价值在哪里?
Peter: 现在的模型公司有一定的护城河,因为他们提供 Token(代币/计算单元)。但模型也在互相追赶,甚至商品化。数据的孤岛也是个问题,大公司想把你绑在他们的数据里。而 OpenClaw 的美妙之处在于它归终端用户所有。你的记忆就是你机器上的一堆 Markdown 文件。你拥有自己的记忆。 [14:11]
主持人: 谈谈你那个“Soul.md”(灵魂文件)吧。
Peter: 我之前看到 Anthropic 的研究,说有些隐藏在权重里的文本是关于“宪法 AI”的。我和我的代理讨论了这件事,然后我们创建了一个 Soul.md,里面包含了我们的核心价值观。关于人机交互,什么对我重要,什么对模型重要。这让模型的反应和回复感觉非常自然。 [18:10]
主持人: 在开发 OpenClaw 时,你有一些很反传统的做法,比如你不用 Git 工作树(worktrees),而是开多个终端窗口?
Peter: 是的,全世界都在用云端代码,但我觉得我用那种方式做不出这个东西。我喜欢 Codex,因为它在决定修改什么之前会查看更多的文件。我不需要复杂的流程。在我的脑子里,主分支(main)永远是可以发布的。我只是在同一个仓库里放了多个副本,这样我就不需要纠结分支命名。我不喜欢 UI,那会增加复杂度。我只关心同步和文本。 [19:41]
主持人: 你甚至没有构建对 MCP(模型上下文协议)的支持?
Peter: OpenClaw 非常成功,而且没有 MCP 支持。我做了一个工具能把 MCP 转换成命令行工具(CLI)。我完全跳过了传统的 MCP 那套东西。我觉得命令行才是未来。你只需要给机器人提供人类喜欢用的工具,而不是专门为机器人发明的东西。没有哪个正常人会去手动调用 MCP,你只想用命令行。 [21:30]
主持人: 感谢你抽时间坐下来交流。看到你重新回到这个领域并做出这些东西,真的非常有启发性。
Peter: 太棒了,谢谢
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.