2024年,亚马逊应用科学经理Vivek Khare管理的BuyForMe系统已能自动帮用户在第三方网站下单。这个项目动用了数十人团队,横跨多个部门,是典型的"大厂重兵投入"模式。
三个月后,Khare单人匹马做出了另一个AI系统——从设计到上线,没有下属,没有跨部门会议,没有OKR对齐。两个系统的核心能力惊人地相似:都能理解需求、自主执行、完成交易闭环。
人力投入差了10倍以上,产出效率却接近持平。
这不是"降本增效"的口号,而是一次被验证的范式转移。Khare把这段经历写成了一份实操手册,核心命题是:当AI能替代的不只是执行层,而是管理层协调成本时,创业的游戏规则怎么变?
从"管科学家"到"指挥AI代理"
BuyForMe的架构很典型:需求理解模块、网页解析模块、执行规划模块、支付安全模块——每个模块背后是一组科学家,每周同步进度,每月复盘指标。Khare的工作是确保这些模块能拼成完整的用户体验。
2024年中,Khare开始实验另一种组织形态。他用多智能体系统(Multi-Agent System,多个AI代理协作的架构)重建了类似能力:一个代理负责理解用户想买的商品,一个代理浏览网页提取信息,一个代理生成购买策略,一个代理执行操作。
关键差异在于协调成本。人类团队需要会议、文档、绩效面谈;AI代理之间的"协作"通过提示词(Prompt,给AI的指令)和状态共享完成。Khare发现,当代理数量控制在5个以内时,他个人的调试效率远高于管理同等规模的人类团队。
这个发现直接催生了他的创业项目LAIMA——一个端到端的AI驱动电商平台,专注宠物主题T恤的定制设计与销售。
LAIMA的极简架构:4个代理撑起完整业务
传统电商创业需要的设计师、文案、运营、客服,在LAIMA被压缩成四个AI代理:
需求挖掘代理:持续扫描Reddit、TikTok、宠物社群,识别正在发酵的宠物话题。不是简单的关键词抓取,而是判断"这个话题有没有情绪张力,能不能转化成设计元素"。
设计生成代理:将话题转化为T恤图案。Khare没有训练专属模型,而是组合使用Midjourney生成视觉、GPT-4优化提示词、自研脚本控制风格一致性。关键技巧是建立"设计DNA"——一套可复用的风格参数,确保不同批次的产品看起来像出自同一品牌。
店铺运营代理:自动完成商品上架、定价测试、库存监控。Khare提到一个细节:代理会主动进行A/B测试,比如同一设计换不同标题投放,24小时内根据点击率自动淘汰低效版本。
客服代理:处理售前咨询和售后问题。训练数据来自Khare手动回复的前200单——他刻意保留了口语化的表达习惯,避免AI客服常见的"过度礼貌但解决不了问题"。
整个系统的"人力成本"是:Khare每天投入2-3小时处理代理无法决策的例外情况,其余时间由四个代理自主运转。
三个反直觉的实操教训
Khare在复盘时强调了几个与"AI创业常识"相悖的发现:
第一,"端到端"不等于"全自动"。 他尝试过让系统完全无人值守,结果在第三周出现了一次定价错误——代理把一件T恤标成了0.99美元,两小时内被薅走400件。现在的设计是"代理提议+人工确认"的关键节点控制,Khare称之为"人在环内"(Human-in-the-loop)的轻量版本。
第二,提示词工程比模型选择更重要。 他测试过GPT-4、Claude 3、Gemini 1.5,最终发现同一模型在不同提示词下的表现差异,远大于不同模型在同等提示词下的差异。他花了40%的初期开发时间打磨"需求挖掘代理"的提示词模板,反复调整"什么算有价值的话题"的判断标准。
第三,失败案例比成功案例更有训练价值。 设计代理早期生成的图案有30%被Khare直接否决——不是审美问题,而是"印到T恤上卖不动"。他把这些否决案例整理成"负面示例库",代理的后续产出合格率从70%提升到92%。
大厂经验哪些能迁移,哪些不能
Khare对比了两个项目的资源差异。BuyForMe有专门的合规团队审核每一笔代理代下单的合法性,LAIMA只能依赖平台(Shopify、Etsy)的既有规则,用"小步快跑+快速下架"替代事前审查。
BuyForMe的科学家团队能针对特定网站定制解析模型,LAIMA则完全依赖通用网页浏览代理,遇到复杂交互(如需要短信验证的结账流程)直接放弃该渠道。
但有一项能力完全复用:对"代理失败模式"的预判。Khare在亚马逊时建立了一套故障分类体系——理解错误、执行错误、环境变化、对抗攻击——这套框架移植到LAIMA后,帮他快速定位了80%以上的异常订单根因。
「管理科学家和管理AI代理,底层逻辑都是降低系统的不确定性。」Khare写道,「区别在于,人类的不确定性来自动机和沟通,AI的不确定性来自上下文窗口和工具调用边界。」
截至2024年底,LAIMA的月销售额稳定在8000-12000美元区间,毛利率约35%。这个数字不算惊人,但支撑它的运营成本——主要是云服务和平台佣金——每月不到2000美元。Khare没有融资计划,「先验证这个模型能自我维持,再考虑放大。」
他在文末留下了一个未回答的问题:当单个创始人用AI代理就能运行一个完整业务单元,风险投资的标准估值模型——基于团队规模、烧钱速度、市场份额——还适用吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.