一个本地大模型,没有预设脚本,纯靠试错学会砍树、挖矿、合成工具——听起来像天方夜谭?但有人真这么干了,而且全程直播。
一张图看懂Kiwi-chan的"脑回路"
![]()
如果把Kiwi-chan的决策过程画成流程图,大概长这样:
【核心循环】感知环境 → 生成代码 → 执行动作 → 观察结果 → 失败?→ 触发"Coach"模块 → 生成替代方案 → 重试
这个循环在4小时的直播里跑了不知道多少轮。作者记录的日志显示,AI的"矿工生涯"堪称一部微观失败史:想砍橡木,失败;换泥土,不行;试白桦木,还是崩;最后连煤都不放过——像个在沙漠里找水的迷路旅人。
但有趣的不是失败本身,是失败后的反应。
为什么"卡住"比"做错"更可怕
作者提到一个细节:系统对移动距离有硬约束。如果AI没走出足够远的距离,直接报错。
这看似苛刻,实则是防死锁的关键设计。LLM生成的代码很容易陷入"原地打转"——比如反复尝试同一个不可能成功的动作。强制位移检查,相当于给AI装了个"物理闹钟":动不了?那就是真卡了,别硬撑。
对比之下,那些"优雅"的失败反而被允许。砍橡木不行就换白桦木,这种策略调整正是学习发生的痕迹。
「The logs show a clear pattern: failure to gather oak logs leads to attempts at dirt, then birch logs」——作者的观察点出了核心:AI不是在执行固定流程,而是在构建自己的"资源获取优先级列表"。
代码即记忆:LLM如何"长记性"
另一个反直觉的发现:Kiwi-chan的"学习"不发生在权重更新里,而发生在代码生成中。
每次失败后,后台都在跑代码修复。作者注意到几个关键进步:
• 严格遵守"不写死坐标"的规则——意味着AI必须实时感知位置,不能偷懒记答案
• 把"合成"和"放置"拆成独立步骤——避免动作耦合导致的连锁错误
• 自动处理物品名映射(stone→cobblestone)——《我的世界》的老坑,新手人类玩家都常踩
这些不是预编程的,是LLM从错误中"想"出来的。所谓的"brain log"里,失败记录被结构化存储,成为后续决策的上下文。Qwen模型提供的"Recovery Plan"更像一份动态应急预案:当主策略崩溃时,有现成的B计划可切换。
木镐时刻:为什么这个工具这么重要
直播的高潮(如果4小时磨洋工也能叫高潮)是AI尝试合成木镐。
在《我的世界》的生存逻辑里,木镐是技术树的第一道门槛。没有它,只能用手挖泥土和沙子,永远拿不到石头,更别提铁和钻石。从游戏设计角度,这是"限制性进度"的经典案例:用工具锁定资源,用资源解锁新工具。
Kiwi-chan的"慢",恰恰暴露了纯LLM agent的瓶颈:它必须亲身体验这个因果链,而不是像人类玩家那样"知道"该做什么。检查库存、确认材料、执行合成——每一步都要生成代码、执行、验证,任何环节出错就回滚重来。
作者说「Hopefully, it has enough planks and sticks!」时的语气,像极了一个看孩子第一次自己系鞋带的老父亲。
本地LLM的隐藏成本:一张显卡和一杯咖啡
文末的求赞助不是客套。作者坦白:「This whole operation is running on a prayer and a rapidly overheating GPU」。
这揭开了另一个反常识的事实——本地部署的"小"模型,推理成本未必低。Kiwi-chan的架构需要频繁调用LLM生成代码、诊断错误、规划恢复策略,每次生成都吃显存。4小时的直播背后,可能是风扇狂转的显卡和不断膨胀的电费单。
买咖啡链接的存在,也说明这类项目的可持续性困境:技术演示很酷,但谁来为"看AI慢慢学习"买单?
这玩意儿到底有什么用
回到最务实的问题。一个会在《我的世界》里死磕木镐的AI,除了娱乐价值,还能干嘛?
三个可能的落地方向:
第一,游戏测试自动化。传统脚本需要人工编写所有边界情况,而LLM agent可以探索"人类没想到的作死方式"——比如执着于用泥土造工具。
第二,机器人流程验证。把Minecraft换成真实工厂的仿真环境,Kiwi-chan的架构可以测试"如果传感器读错,系统会如何恢复"这类问题,比纯模拟更贴近真实故障模式。
第三,教育场景的原型。展示AI如何从错误中学习,比任何算法讲解都直观。毕竟,谁没看过一个新手玩家在《我的世界》里饿死呢?
作者最后的判断很克制:「slow progress, but it's steady progress」。没有宣称通用人工智能,没有夸大技术突破,只是记录一个本地LLM在受限环境里,用笨办法一点点啃下生存技能的过程。
这种诚实本身,在当下的AI叙事里反而稀缺。
如果你也在折腾本地大模型,或者单纯想看一个数字生命如何跌跌撞撞地"活"下去,这个项目的日志值得翻一翻。买杯咖啡支持一下也行——毕竟,你的显卡可能也在某个角落默默 overheating 呢。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.