允中 发自 凹非寺
量子位 | 公众号 QbitAI
关于AI的讨论其实越来越两极化。
一边是技术飞速推进:模型能力在变强,Agent在出现,OpenClaw开始能调用工具、执行任务、操作系统。
另一边,则是越来越普遍的情绪——AI焦虑。
很多人都在问同一个问题:如果AI不只是聊天工具,而是开始真正参与工作流程,那人类的位置会发生什么变化?
大多数讨论其实都只停留在想象层面。有人觉得AI马上取代一切,也有人觉得它只是玩具。
但真正的问题在于另一件事——AI在真实世界里,究竟已经走到了什么程度?
于是,B站最近干脆把这件事做成了一档直播挑战:让AI进入真实任务环境,在直播里接受压力测试。他们直接把这个问题,做成了一场公开实验。
一个官方策划的直播系列——《龙虾代替人类》挑战。
![]()
逻辑其实很简单:
让不同领域的UP主,在直播中把真实任务交给OpenClaw执行,从任务拆解、资料查询到实际操作,都尽量让AI去完成。
重点不是演示,而是真实过程。
直播意味着没有剪辑、没有重来。如果卡住、出错、甚至翻车,观众都会实时看到。
换句话说,这更像是一场公开的技术压力测试。
昨天(3月13日)已经有一场直播跑了一轮测试。
纯用AI开发了爆款产品小猫补光灯App的UP——AI进化论-花生,把“龙虾”直接拉去当程序员。
简单讲完基础使用(比如如何判断系统运行、模型接入和部署注意事项)后,他就开始给AI扔任务。
前两个任务其实翻车得挺真实:
先让Claude Code配合龙虾分析他的B站账号并给出选题建议——第一次直接失败,第二次才跑通流程;随后又尝试让AI整理桌面,但因为执行速度太慢,最终也没跑完。
但第三个任务就有点意思了。花生让AI开发一个iOS小猫补光灯App的升级版。结果AI居然真的把应用做出来了。
当然过程也很戏剧化:
龙虾会把任务分配给Claude Code协作,但又时不时“不太信”Claude的建议;有一次花生让它修改代码,它甚至“偷懒”没执行指令。
最后花生给了个很有意思的评价:
龙虾在产品思路和编程能力上确实很强,像个有几年经验的产品经理,但目前做出来的版本整体还比较粗糙,需要继续打磨。
![]()
接下来几天的直播内容会更丰富一些:
今晚(3月14日)的直播阵容会更有意思。
导演小策和Jack-cui会把AI拉进完整的视频创作流程,让它参与选题、脚本甚至编导,看看内容生产链条里加入AI Agent会不会产生新的创作方式。
而另一场更抓眼球的实验还在继续,来自UP主程泓宁_宇宙ebike。
他的挑战目标很直接——用OpenClaw,一天卖出100万。
验证AI到底是商业能力的第一次高光时刻,还是直播间大型翻车现场?这几天大概就会有答案。
3月16日,UP主籽岷、图灵的猫、马夫鱼33会让AI去打游戏,看看AI代打到底是高光操作还是现场翻车。
还有一场设定更极端一点:
3月20日UP主秋芝2046准备让AI参与公司管理,《用龙虾管公司,会倒闭吗?》。
另外一个小看点,是神秘嘉宾。
官方已经透露会有周鸿祎参与,不过具体内容还没公布。
整个系列看下来,其实有点像AI龙虾版的真人秀。
![]()
其实从更大的视角看,这件事的意义可能不只是一次直播挑战。
今天很多关于AI的讨论,其实都建立在情绪之上——有人过度乐观,有人极度焦虑。
但技术的发展,最终还是要回到一个最现实的问题:它到底能不能在真实世界里工作。
![]()
所以这次直播,本质上更像一次公开实验。
让AI在真实任务、真实时间和真实压力下跑一遍流程。
看看它到底能做到什么程度,也许结果不会完美,但至少比任何讨论都更接近事实。
如果你身边有人正在讨论——AI会不会取代人类、未来工作会变成什么样,不妨让他亲自了解行业中深度使用者的使用情况。
因为很多问题,只有在真实实验里,答案才会慢慢出现。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.