![]()
AI代理(智能程序)能写代码、能画图、能订机票,但遇到「需要真人动手」的环节,集体卡壳。Deploy Humans这家公司专门接这种「AI干不了的脏活」,在HackerNoon的实用性评分体系里拿了108分——比第二名高出3倍。
108分是怎么算出来的
HackerNoon的「实用性证明」(Proof of Usefulness)不是用户打分,是一套算法:产品解决的具体问题数量 × 问题被搜索的频率 × 解决深度。Data Horizon做GA4对话分析,34分;Image to Photo修复老照片,28分。Deploy Humans的108分,说明它解决的是高频、刚需、且别人没碰的痛点。
这个分数的离谱之处在于,它做的不是「更聪明的AI」,而是「AI的四肢」。当AI代理需要真人去线下验房、去仓库盘点、去医院代排队,Deploy Humans就是那张调用人类劳动力的API(应用程序接口)。
创始人把这叫「人类执行层」(Human Execution Layer)。听起来像众包平台?差别在于颗粒度。传统众包是「发任务-等人接」,Deploy Humans做的是「代理直接调用」,人类劳动者被封装成可调用的函数,响应时间按分钟计。
代理经济的 Plumbing(管道系统)
类比一下:AI代理是水龙头,能出水,但水管、水压、净水系统全是别人铺的。Deploy Humans铺的是最后100米——当代理说「我需要有人去旧金山这套公寓拍360度视频」,系统要在17分钟内找到人、派单、验收、返图。
这套系统的难点不在技术,在「确定性」。AI可以接受80%的准确率,但代理调用人类必须100%交付,否则整个自动化链条断裂。他们解决的方式很笨:把任务拆到原子级,每个动作有SOP(标准操作流程),验收用计算机视觉+人工抽检双保险。
目前覆盖的场景三类:线下验证(房产、车辆、设备)、物流辅助(最后一公里取送、仓内操作)、行政代办(排队、递交、签收)。全是AI看得见、摸不着的事。
为什么是现在
2024年被称为「代理元年」,但代理的幻觉问题没解决。一个房产代理可以生成完美的房源描述,但无法确认「照片是不是三年前拍的」。Deploy Humans的商业模式建立在「AI的诚实性缺口」上——代理越普及,对真人验证的需求越刚性。
他们的客户不是C端用户,是B端的代理开发商。一家做跨境租车的公司,代理能完成90%的预订流程,但车辆交接必须真人验车。以前自己养本地团队,现在调用Deploy Humans的API,按次付费。
![]()
这种「基础设施」定位意味着网络效应:劳动者端,覆盖城市越多,代理开发商越愿意接入;客户端,接入的代理越多,劳动者单量越稳定。目前他们在北美12个城市跑通,单均响应时间14分钟,履约率97.3%。
108分之后的挑战
评分高不代表生意好做。人类执行层的核心矛盾是「规模化vs标准化」:每个城市的劳动法规不同,每个任务的验收标准浮动,劳动者培训成本随场景指数上升。
更隐蔽的风险是「被替代」。计算机视觉在进步,无人机验房、机器人配送都在蚕食他们的地盘。Deploy Humans的应对是「做AI够不着的高频场景」——不是技术做不到,是成本做不到。让无人机飞一趟验房,电费加折旧比人工贵,这就是窗口期。
HackerNoon的评分体系里,还有一家做老照片修复的拿了28分。技术很美,但需求低频。Deploy Humans的108分,赌的是「代理需要人类」这件事,在五年内都是常态。
如果代理经济真成了,人类执行层会变成水电煤一样的存在;如果代理始终离不开人类复核,那Deploy Humans就是那个「让AI保持诚实」的幕后角色。你觉得哪种未来更可能?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.