89次尝试,35次成功,54次失败。这个数字组合背后,是一个Minecraft智能体在4小时内的真实生存记录。它不是游戏直播,而是一份关于"机器如何学习避坑"的技术日志。
人物:一个会给自己找麻烦的AI
![]()
这个叫Kiwi-chan的智能体,开发者给它设定的目标很具体:自动放置箱子建立营地,解决背包满格的问题。听起来像新手教程级别的任务,对吧?
但开发日志里的细节暴露了残酷现实。「它真的不喜欢Vec3」——这句开发者原话揭开了AI训练的冰山一角。Vec3是一种三维向量坐标表示法,在Minecraft里用来定位方块位置。它的代码生成器反复调用它,又反复触发安全校验失败,最后整个生成流程崩溃。
开发者没有修补这个模块,而是直接把它拉进黑名单。这个决策本身就很耐人寻味:当AI的某个行为模式持续产生负面结果,最经济的解法不是优化它,而是禁止它。
更值得关注的是失败后的自救逻辑。当日志显示「recovery system is kicking in, suggesting explore_forward as a fallback」,系统正在执行一套预设的环境切换策略——既然放箱子卡住,那就先去探索新区域,改变当前状态后再回来尝试。
这不是简单的错误重试,而是带有状态评估的决策转移。
逻辑:为什么"学会不做什么"比"学会做什么"更难
传统机器学习强调正向奖励:做对了就加分,模型朝着高分方向迭代。但这份日志呈现的是另一套学习范式——负向知识的沉淀。
Vec3问题是个典型案例。从代码生成到安全校验失败,再到被系统拉黑,这个链条里没有"正确答案"可供学习,只有"此路不通"的标记。开发者形容这个过程为「actively learning what not to do, which is just as important as learning what to do」。
这种学习的代价是显性的。54次失败里,大量集中在place_chest(放置箱子)这个动作上。日志显示问题出在两个环节:代码提取流程本身不稳定,以及Vec3引发的次生故障。成功率被压缩到39.3%,接近随机波动的下限。
但开发者态度是「not discouraged」。原因藏在另一个数据点里:核心生存规则仍在运转——持续探索、采集资源、扩展技能库。营地系统(Camp System)的逻辑框架已经开始成型,即使具体功能还没跑通。
这里有个产品设计的隐喻:当主功能链条断裂时,保底机制决定了系统是否值得继续投入。当前的保底是「explore_forward」,一个低阶但可靠的替代动作。
对比之下,早期版本有个被提及的「oak log obsession」(橡木原木执念)——它会无意义地重复采集同一种资源。这个问题已经被解决,说明系统具备行为矫正的历史记录。
影响:从游戏AI到自主系统的距离
开发者用了一个很重的词:「a small step towards true autonomy」(迈向真正自主性的一小步)。这个判断基于什么?
日志里有两个信号。第一是「self-diagnose and propose recovery plans」——它能在故障后生成诊断结论并建议恢复方案。第二是环境感知与动作切换的联动,即识别"卡住"状态后主动改变外部条件。
这两个能力的组合,构成了自主性的最低 viable 定义:不是执行预设脚本,而是基于状态评估动态调整策略。
但距离真正的产品化还有明显 gap。89次尝试只覆盖"放置箱子"这一个功能点,且成功率不足四成。开发者坦承这是「slow burn」(慢火细熬),并公开了硬件瓶颈:当前的"弗兰肯斯坦"GPU集群需要升级到RTX 3060才能支撑更复杂的模型训练。
这个细节暴露了AI开发的一个隐性成本结构。算力限制不仅拖慢迭代速度,还直接约束了模型复杂度上限——更复杂的决策网络需要更强的并行计算能力,而目前的硬件显然在临界点挣扎。
从行业视角看,这种困境具有普遍性。大模型在开放环境(open-ended environment)中的任务完成率,往往远低于封闭场景。当动作空间无限延伸、失败成本无法预估时,"学会不做什么"就成了比"学会做什么"更紧迫的课题。
日志里还埋着一个值得玩味的细节:开发者提到「avoiding that oak log obsession, thankfully」。这个"thankfully"背后,是无数次调试和干预的省略。自主性从来不是一蹴而就的顿悟,而是对错误行为的持续修剪。
39.3%的成功率不好看,但它测量的是真实世界的摩擦系数。当系统开始记录自己的失败模式、建立黑名单、设计逃生通道时,它已经在做一件比"完成任务"更底层的事——构建关于自身局限性的元认知。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.