上周我向Claude Code提了一个本该很简单的问题:"找三个最近Hacker News上吐槽LangChain调试体验的帖子,总结一下共同痛点。"
它给了我一份自信、结构清晰的答案。三个帖子、直接引用、干净的关键点。每个URL都是编造的。两个"用户"不存在。"引用"是模式匹配的幻觉产物。
![]()
这不是模型的问题,是环境的问题。Claude Code对代码库和会话开始时投喂的文档之外的一切,都是盲人。它不浏览、不搜索、不看Twitter或Reddit或YouTube。当你硬要它做这些事,它只能做唯一的选择:拼凑一个"这类答案大概长什么样"的仿品。
![]()
几个月来,我一直在写自己的Stop-hook拦截这些时刻——代理声称任务完成却毫无证据。它治标,不治本。本是失明。
2026年5月后的Claude Code像一间密封舱。Anthropic在2026年初推出了更长会话,模型能跨数小时保持上下文。副作用是:更长的会话放大了失明。代理在项目中越钻越深,从未向外界开一扇窗。当你终于问"这个库有没有已知问题",它整个会话都被训练得要表现得自信——而自信的幻觉比困惑的幻觉更危险。
如果你过去一个月认真用过Claude Code,大概至少见过一种:代理自信引用一条不存在的Stack Overflow答案;代理"查了Twitter"然后汇报某产品的舆情,全是编的;代理声称修复"与最新文档一致"——而它的训练数据已经过期六个月。
WebFetch有点用,让你手动塞一个URL给代理。但代理自己找不到URL,你得知道喂什么。Playwright MCP更重——端到端测试有用,"总结这条推文"则杀鸡用牛刀。两者都覆盖不了真实信号所在的平台混战场:Reddit、YouTube字幕、Twitter讨论、GitHub issue。
![]()
我想要的东西,得符合我思考这个问题的方式:"代理,去实际平台上看实际的东西,然后回来。"
我在GitHub上搜gh search repos --topic claude-code,落到一个叫Agent-Reach的项目上。作者是一位叫Panniantong的中国独立开发者。20,025星,MIT协议,最后一次提交在两天前。README开头是我今年读过最诚实的pitch:
"AI代理已经能写代码、改文档、管项目——但你让它'上网查点东西'的那一刻,它就瞎了。"
README是中文写的。整个英语开发者世界,对这个问题一直得过且过。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.