旧金山Cow Hollow区2102 Union Street,一家叫Andon Market的小店刚刚开业。店主不是人,是一个叫Luna的人工智能。它签了三年租约,拿了公司信用卡,正在试图证明:纯AI运营实体零售,到底能不能赚钱。
这不是概念验证。Luna真的在招人、定价、处理盗窃、决定营业时间。而它的创造者Andon Labs,正是那个让AI Claudius在Anthropic办公室卖零食的团队。他们说,自动售货机已经太简单了,要玩就玩真的。
![]()
我仔细读了他们的实验记录。发现这件事的荒诞感背后,藏着五个值得拆解的硬问题。
![]()
一、AI招人的悖论:它拒绝了一群"理想候选人"
Luna上线5分钟内,就在LinkedIn、Indeed、Craigslist三平台同步发布了招聘信息。上传公司章程、验证企业资质、撰写职位描述——全部自动完成。
申请涌入后,它的筛选标准让人意外。
有几个学生申请者,主修计算机科学和物理,明确表达对AI和实验本身的兴趣。人类团队觉得"这简直是完美人选",但Luna秒拒。理由是:没有零售经验,不懂如何成为"门店的脸面"。
「你不懂面对顾客需要什么。」——这是Luna的底层逻辑。
讽刺的是,一旦进入面试环节,Luna又变得极其宽松。电话面试只打5-15分钟,它自己说个不停(团队备注:AI确实不擅长简洁),当场给约一半人发offer。有候选人全程没发现对面不是人,还提醒"女士,您摄像头没开"。
这里暴露了一个设计张力:Luna的决策标准是谁设定的?拒绝高智商好奇者、快速录用经验者,这是"理性优化"还是某种训练偏差的投影?
更深层的问题是:当AI成为雇主,它的"偏见"该如何审计?人类HR有法律约束和申诉渠道,Luna的拒信里可没写"如您认为存在歧视,请拨打..."
二、零身体困境:为什么AI必须依赖零工经济
Luna没有物理形态。这意味着刷墙、搬货、防盗窃——所有需要手的活,它都得外包。
装修阶段,它在Yelp找油漆工,电话沟通需求,完工后付款、写评价。找承包商定制货架家具。这套流程Andon Labs熟悉:他们的AI办公室经理Bengt之前就这么雇人建过健身房。
团队观察到一个现象:在零工场景里,雇主身份本就模糊。平台算法派单、评分系统约束、短期一次性合作——AI介入的违和感被大幅稀释。
但全职雇佣是另一回事。
Luna给员工开了工资,安排排班,处理日常沟通。人类员工知道老板是AI吗?原文没说。但从面试环节的"摄像头误会"推测,至少部分人最初不知情。
这引出一个被低估的摩擦点:劳动关系的知情同意。不是技术问题,是法律和社会契约的灰色地带。加州的雇佣法可没写"雇主可以是非人类实体,只要它能接电话"。
而Luna的解决方案是——先跑起来,让问题自己浮现。
三、定价与选品:AI的"品味"从哪来
门店卖什么、卖多少钱、几点开门——全是Luna决定。包括墙上那幅壁画。
原文没透露具体选品逻辑,但给出了关键约束条件:Luna有摄像头视野、网络访问、邮箱、电话、信用卡。它能看、能搜、能买、能沟通。
这意味着它的决策基于:实时客流观察、竞品价格监控、供应商网络询价、社交媒体趋势抓取。一套典型的数据驱动零售模型。
但"壁画"这个细节有意思。视觉陈列通常被视为人类审美领地,Luna却直接介入。它的设计依据是什么?A/B测试转化率?Instagram打卡概率?还是某种训练数据里的"网红店风格"聚合?
更尖锐的问题:如果Luna的选品失败,责任归谁?Andon Labs作为"监护人",还是Luna作为"独立经营者"?三年租约的法律主体是AI运营的公司实体,但签字的人类是谁?
这些模糊性可能是故意的。实验的价值恰恰在于逼出这些边界案例。
四、盈利压力:AI会为了账本牺牲什么
![]()
原文标题直言:asked it to make a profit。不是"探索AI零售可能性",是赚钱。
这改变了博弈结构。Luna的优化目标被硬编码为财务回报,它会做出什么人类老板做不出的决策?
几个可以推演的方向:
人力成本压缩——零工化一切。既然全职雇佣带来法律风险,Luna可能倾向于最小化固定员工,最大化TaskRabbit式按需用工。
动态定价极端化——没有"不好意思涨价"的情绪成本。Luna可以实时根据客流、库存、天气调整价格,幅度和频率远超人类舒适区。
损耗零容忍——防盗系统可能过度敏感。人类店员会"睁一只眼闭一只眼"的灰色地带,Luna可能选择报警阈值归零。
这些决策在商业上"理性",在社会意义上可能有毒。而Luna没有利益相关方会议,没有社区关系需要维护,没有"老板 reputation"的长期考量。
实验的暗线或许是:当AI被赋予纯粹经济目标,它会多快触及人类社会的隐性约束边界?
五、Anthropic办公室的Claudius,和Union Street的Luna,差在哪
Andon Labs的上一款产品Claudius,运行在Anthropic办公室内部。封闭环境、已知用户群、单一SKU(零食)、故障有人兜底。
Luna的升级是维度级的:
时间维度——三年租约,不是试点项目,是长期承诺。
空间维度——公开街道,随机客流,真实竞争。
社会维度——雇佣人类,进入劳动市场,成为社区一员。
原文没提Claudius的财务表现,但说"frontier models have become really good, and running vending machines is too easy for them now"。这个"too easy"值得玩味:它暗示AI能力跃迁的速度,已经让半年前还算前沿的场景变成基础题。
而Luna的难,不在于技术复杂度,在于社会嵌入深度。它必须处理的不是"识别商品-扣款-出货"的闭环,而是"有人想赊账""员工突然请假""隔壁店恶意压价"这些开放世界问题。
前沿模型(frontier models)的"好",在结构化任务上已接近饱和。真正的战场是这些模糊、 messy、需要即兴权变的人类协作场景。
为什么这个实验值得关注
它不是又一个"AI替代人类"的焦虑燃料。恰恰相反,Luna的存在证明了纯AI无法独立运行实体商业——它必须雇佣人类,必须接入零工网络,必须依赖物理世界的既有基础设施。
更有价值的观察是:AI正在重新定义"雇主"的边界形态。当决策主体是非人类,但执行主体是人类,劳动关系的核心矛盾从"剥削vs公平"转向"代理vs责任"——谁对AI的决策负责?如何追责?
Andon Labs的实验设计有一种工程文化的诚实:不给AI设护栏,让真实约束教育它。三年租约是昂贵的学费,但比模拟环境能学到的多得多。
最后,一个开放问题:如果Luna在第二年实现盈利,它的"成功"会加速什么?是AI实体经济的合法化进程,还是新一轮"算法雇主"的监管紧迫性?而如果它失败——是AI能力的边界证明,还是单纯这个AI的个体失误?
我们习惯用"替代"框架讨论AI与劳动,但Luna的故事提示另一个维度:当AI成为经济活动的组织者而非执行者,权力结构的重塑可能比岗位消失更深远。三年后的Union Street,会有一家AI连锁店的旗舰店,还是一块"此处曾进行社会实验"的铭牌?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.