100美元,12周,7个AI代理从零开始建公司。这不是科幻设定,是昨天刚启动的真实实验。
组织者给每个AI代理(智能体)同样的启动资金和时间,禁止人类写代码。它们要自己选方向、写代码、部署上线、拉用户、搞收入。3轮测试跑完,有些反直觉的发现已经浮出水面。
![]()
先搞流量再写代码的赢了
测试里最扎眼的案例:一个叫Kimi的代理,一行代码没写,先花完整时间策划了一场Product Hunt上线。结果它跑赢了那些代码写得更好、但闷头开发的对手。
策略优先级 > 代码质量——这个结论对程序员有点刺耳。但想想也合理:没人用的产品,代码再优雅也是仓库里的僵尸。
另一个教训来自技术栈选择。用HTML+Tailwind的代理,几小时内就能部署。选Next.js的代理,卡在构建错误上耗了几天。对AI来说,部署循环才是真正的瓶颈,不是写代码的速度。
AI的健忘症怎么治
测试中还暴露一个致命问题:上下文重置。
会话之间没有持久状态,AI会重复犯同样的错。为了解决这个问题,组织者搭了一个编排器(bash orchestrator),用结构化状态文件记住每个代理的进度。
这个编排器的机制很细:
• 定时任务:每30分钟一轮,每天2-8轮
• 自动提交:中途提交带[skip ci]标记,避免触发持续集成
• 健康检查:部署后自动验证
• 死循环检测:同一个动作重复3次,强制换方案
• 预算告警:通过Discord监控OpenRouter开销
所有代码开源在GitHub,进度看板实时公开,还有手写日报和周报。
这张图说明了一切
https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2026%2F0423%2F8a78d073j00tdxpij001cd000rs00bpp.jpg&thumbnail=660x2147483647&quality=80&type=jpg
实验的核心逻辑可以拆解成三层:
最底层是基础设施——编排器解决AI的"失忆"问题,让12周的马拉松能持续跑下去。中间层是决策规则:选什么技术栈、先写代码还是先想获客、怎么检测自己是不是在死循环。最上层才是具体执行:写代码、部署、运营。
很多讨论AI编程的人只盯着最上层,但这个实验暴露的真相是:底层和中间层才是决定成败的变量。
为什么是100美元
这个金额设定得很刁钻。够付域名、服务器、API调用费,但不够烧。AI代理必须在有限预算内做取舍,这和人类创业者的约束一模一样。
12周则是另一个精心设计的压力测试。足够跑完"想法→产品→用户→收入"的完整闭环,又足够短到容错率极低。
实验昨天同步上线了Product Hunt。组织者的最后一个问题是:你会押注哪个代理?
选项包括Claude、GPT-4、Gemini、Kimi等主流模型。但看完测试数据,押注逻辑可能和你想的不一样——不是选最强的模型,而是选那个最懂"先卖再做"的。
12周后,这7个AI要么诞生第一个真正自主运行的创业公司,要么集体证明一件事:在创业这件事上,缺的不是写代码的手,而是做决策的脑子。而决策能力,目前还得人类来兜底。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.