网易首页 > 网易号 > 正文 申请入驻

ROI这口利剑,终于悬在了AI员工头顶

0
分享至



过去,AI公司习惯按使用量收费。无论是token消耗制还是额度制,本质上都是“用多少、付多少”。

这套模式适合模型API,却未必适合越来越深入工作流的企业Agent。为了完成一个任务,它们会不断读取上下文、提炼信息、调用工具……token消耗很容易膨胀。

一些企业甚至开始出现token maxxing的情况——员工和Agent不断增加AI使用量,却很难证明这些token最终创造了多少价值。

如此这般,企业AI的成本越来越高,生产力回报却并不总是清晰。Gartner预计,到2028年,AI编程工具的成本甚至可能超过开发者薪资。

就在大家还在讨论token该怎么省的时候,AI编程Agent公司Cognition提出了另一种思路:

它没有继续强调Devin消耗了多少token,而是把Devin完成的工作折算成“等效工程师小时”,再换算成美元价值。更进一步,Cognition还推出了Productivity Guarantee——如果Devin创造的工程价值低于客户支付的费用,公司将返还最高1000万美元额度的使用credits。



比起“AI能不能干活”,Cognition试图回答另一个老板更为关心的问题:

这个AI员工,到底值不值这个价。

01

token消耗只是成本,不是价值

单看产品形态,Cognition的主产品Devin仍然属于AI编程Agent:写代码、修Bug、提交PR,都是这个赛道里的标准能力。让它脱颖而出的是,Cognition没有把Devin只当成一个开发者工具来卖,而是把它包装成一套能用ROI来衡量的生产力方案。

在David Senra 6月28日的最新访谈里,Cognition的CEO Scott Wu 专门用了一个章节讨论“Measuring ROI Instead Of Token Spend”(用ROI而不是token消耗,来衡量AI的价值)。

他提到,一些企业开始统计员工用了多少AI、消耗了多少token,甚至把token用量当成内部指标。但这样很容易偏离真正的问题。

因为token消耗只是成本,不是价值。

企业真正关心的根本不是谁用了更多AI,而是这些AI最终完成了多少工作。



Scott Wu举了一个例子:

如果一个原本需要花1500万美元、18个月的项目,最终借助Devin和内部团队,只花100万美元、3个月就完成了,那么对于CEO和CFO来说,这笔投资就是划算的。

他们其实并不在意这个项目花了多少token,甚至不在意你用的是哪家的AI——只要你能帮我解决我的问题、完成我的任务,我就觉得这笔钱画得值。

我用更少的钱、更短的时间,拿到了同样甚至更好的结果,我就赚了。

Cognition会派团队到客户现场,帮他们找适合Devin的使用场景,做用户培训,搭建工作流程,写playbook,配合安全审查和私有云部署。

也就是说,Devin被包装成一套企业生产力改造方案,而不是被当作一个“开箱即用”的工具。

这套打法不太像一家普通SaaS公司,更像一家咨询公司或IT外包公司。企业采购咨询服务,最终买单的是项目成果;采购AI Agent,也正在越来越接近这种逻辑。

在这套逻辑下,Cognition想证明的不只是Devin的代码能力,更重要的是,它值不值得进入企业预算。

02

AI员工的价值,是怎么被计算出来的

问题是,ROI并不是一句空话。

如果Devin要向企业证明自己“值这个价”,Cognition首先要回答一个更具体的问题:一个AI工程师完成的工作,到底怎么换算成美元价值?

Cognition专门写了一篇文章解释这套方法。它承认,直接计算AI带来的商业价值很难——一个PR到底带来多少收入,一个Bug修复到底避免了多少损失,这些很难被精确归因。所以Cognition没有一上来就计算最终商业收益,它选择了一个中间指标:“有效工程师小时”



首先,他们收集了126位企业开发者、258个真实Devin Session的数据。每位开发者都会回答一个问题:如果没有Devin,这项工作你自己需要花多久?

这些真实反馈,被用来训练和校准整套评估系统。之后,每一次Devin完成任务,这套系统都会重新评估它到底创造了多少价值。

整个过程大致可以分为三步:

第一步,先过滤掉无效工作。

不是每一次Devin Session都算生产力。

如果Devin生成了一堆代码,最后没有被采用、没有推进项目、也没有真正解决问题(PR没有被合并),那么这些token消耗就不会被计入价值。

对于没有PR的任务,它还会用分类器判断这个Session是否真的推进了工作。比如查找未使用依赖、扫描安全漏洞、审查PR、跑数据查询、排查Bug等等,这些工作不一定产生代码,但仍然可能是有效工程工作。

相反,如果Devin因为没有权限无法继续,或者向用户追问后没人回复,这类Session就会被过滤掉。

第二步,估算人类工程师完成同样任务需要多少时间。

评估系统会读取整个Session,包括用户需求、Devin执行过程、代码、PR、日志以及代码库上下文,然后估算一名普通工程师完成同样结果需要投入多少时间。

它甚至会考虑很多细节,例如:如果用户已经告诉了Devin具体怎么改,那只计算写代码的时间;如果Bug需要自己定位,那定位时间也要算进去;如果这是一个陌生的遗留代码库,人类需要先花时间熟悉,而Devin已经完成了这部分工作,这些时间同样会计入价值。

第三步,再把工程师时间换算成美元。

Cognition采用统一的工程师成本标准,把“等效工程师小时”转换成美元价值,再与企业实际支付的费用进行比较。

如果创造的价值高于成本,企业获得正ROI;如果低于成本,Cognition就通过Productivity Guarantee返还credits(最高价值1000万美元)。

当然,Cognition并没有宣称这套算法能够精确计算每一个任务的真实价值,他们在技术文档里承认,单个任务的估算可能存在2到3倍误差。但他们认为,随着企业部署规模扩大、任务数量增加,整体平均结果会越来越稳定,更接近AI创造的真实生产力。



这套机制值得关注的地方也不是它能把每一行代码都精确折算成多少钱。重点在于,它把AI Agent的价值衡量,从“消耗了多少token”,转向了“替企业节省了多少工程时间”。

因为那些大体量的客户并不会只因为一个AI产品看起来很酷,就去大规模部署。它们要过预算、合规、安全、采购和财务审核,必须有人解释:为什么这笔钱值得花?

过去,ROI往往是客户内部采购部门、业务部门或财务部门需要自己计算的事。软件公司只负责卖工具,至于工具有没有真正提升效率、节省成本,更多要靠客户自己证明。买了、用了、效果不好,通常也是客户自己消化。

但Cognition把这件事揽了过来,在销售阶段就主动帮客户把这笔账算清楚,还用Productivity Guarantee把一部分风险接了过去。

这套打法也确实成为了Cognition扩张故事的一部分:Cognition在融资时披露,企业用量今年以来增长超过10倍,run-rate revenue已经达到4.92亿美元;同时,它把Citi、Goldman Sachs、Santander、Mercedes-Benz、Dell、美国陆军和海军等大客户放在了最显眼的位置。

Cognition这套逻辑带来的最大价值就在于,它让Devin从工程师手里的AI编程工具,变成了CFO能看懂、采购部门能推进、CEO能批准的预算项。

毕竟,不是所有老板都会写代码,但所有老板都会算账。

03

AI越像员工,就越要看结果

如果把视角从AI编程Agent放大到企业Agent,事实上,按结果衡量价值这件事,客服Agent已经先走了一步。

比如Intercom。它原本就是做客户服务软件的,Fin是它推出的AI客服Agent,它就是按一次成功结果收费,官方价格是每个结果0.99美元。

Zendesk也是类似逻辑,作为老牌客服软件公司,它的AI Agent面向客服工单场景,收费单位是“自动解决”:只有AI独立解决了一次客户问题,才会被计入收费。

Sierra则从一开始就把自己定位成“按业务结果收费”的企业Agent公司,服务客服、销售、续费、退订挽回等场景,客户为AI完成了多少次有效业务结果付费。

因为客服场景的结果最容易定义。用户问题有没有被解决、工单有没有关闭、客户有没有被成功转化……这些结果比“一个PR到底创造了多少商业价值”更容易被衡量。

传统的企业服务本来就看重结果,ROI叙事本身就是企业软件、咨询服务和IT外包行业里非常常见的商业逻辑。可以说,客服Agent率先把这套逻辑转移到了AI领域,而Devin又把这套逻辑搬到了更复杂的软件工程场景。

不过,AI行业里并不是所有产品都适合用ROI直接计费。

底层模型API就像水电煤,模型公司提供的是算力和模型调用能力,客户调用一次模型,就会产生真实的推理成本。所以OpenAI、Anthropic、Google这类模型公司,仍然很难完全摆脱token、调用量或credits计费。

Copilot类产品则更像传统软件,GitHub Copilot、Microsoft 365 Copilot、ChatGPT Business这类产品,主要卖的是一个固定入口和一套使用权限,所以更适合按人头、按月订阅。

但Agent产品不一样。

我们之前在讨论Claude Tag的时候就提过,“AI同事”并不等于免费牛马。

企业Agent越像一个真正的同事,token消耗就越不可能像普通聊天那样可控。当这个AI同事足够聪明、足够勤快、足够愿意加班的时候,企业反而需要限制它的使用。

AI同事也要有预算;而一旦有预算,老板就会继续往下问:这笔预算带来了多少回报?

换句话说,如果AI只是工具,企业可以按使用量、按席位、按额度付费;但如果AI被包装成一个员工,老板自然也会用考核员工的方式考核它。

ROI叙事未必代表AI计费方式的终点,也不意味着所有企业Agent都会立刻转向按成果收费。但Cognition确实在软件工程这个更难量化的场景里,重新建立了一套ROI计算方法,展示了Agent商业化的一条清晰路径。

毕竟,当“AI员工”正式上岗,老板迟早会问一句:

这个AI员工,到底值不值这个价?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杜塞尔多夫官网更新樊振东个人简介和公式照,波尔盛赞樊振东:在他身上,你可以看到一个完美球员所具备的终极平衡;首秀锁定8月22日

杜塞尔多夫官网更新樊振东个人简介和公式照,波尔盛赞樊振东:在他身上,你可以看到一个完美球员所具备的终极平衡;首秀锁定8月22日

鲁中晨报
2026-07-02 10:38:06
菜鸡互啄!世界杯E组和F组八支球队全被淘汰出局

菜鸡互啄!世界杯E组和F组八支球队全被淘汰出局

球事百科吖
2026-07-02 03:46:42
北京大妈公交车上打晕患癌姑娘,一巴掌断送退休后的美好幸福生活

北京大妈公交车上打晕患癌姑娘,一巴掌断送退休后的美好幸福生活

嘉琪Feel
2025-07-09 23:05:01
王健任台州市委书记

王健任台州市委书记

浙江发布
2026-07-02 10:07:47
安赛格坠跳楼后续:4年货款被扣,被罚上千万!整垮企业太容易!

安赛格坠跳楼后续:4年货款被扣,被罚上千万!整垮企业太容易!

眼光很亮
2026-07-02 08:33:55
55票比44票,岛内封杀成功,赖清德开始哭穷,大陆公布统一后安排

55票比44票,岛内封杀成功,赖清德开始哭穷,大陆公布统一后安排

共工之锚
2026-07-02 00:11:47
“凯恩不说话,只是一味进球”,拯救了整个欧洲

“凯恩不说话,只是一味进球”,拯救了整个欧洲

澎湃新闻
2026-07-02 11:58:18
08年新加坡陪读妈妈案:4女1男同住一屋,两个月后,以3死1残收场

08年新加坡陪读妈妈案:4女1男同住一屋,两个月后,以3死1残收场

莫地方
2026-07-02 00:10:59
深市史上最大IPO,今日上市

深市史上最大IPO,今日上市

第一财经资讯
2026-07-02 08:55:44
塞内加尔再遭点球争议!球员躺在点球点上不让罚 专家:他们应退赛

塞内加尔再遭点球争议!球员躺在点球点上不让罚 专家:他们应退赛

风过乡
2026-07-02 07:54:14
二手平台出售超高价玩具人偶,标有身高体重性格等,平台:不涉及儿童贩卖

二手平台出售超高价玩具人偶,标有身高体重性格等,平台:不涉及儿童贩卖

西游日记
2026-07-01 22:30:59
突发!人类首次创造出具有生命大部分特征的细胞

突发!人类首次创造出具有生命大部分特征的细胞

风向观察
2026-07-02 07:34:42
清华大学拟退学一名本科生,穷尽各种方式都无法联系到学生?

清华大学拟退学一名本科生,穷尽各种方式都无法联系到学生?

文忆天下
2026-07-02 09:49:44
赖清德称“近期中国海上行动,是假借执法之名,遂行扩张之实”,国台办:民进党当局已沦为外部势力侵害中华民族整体利益的帮凶,必遭唾弃

赖清德称“近期中国海上行动,是假借执法之名,遂行扩张之实”,国台办:民进党当局已沦为外部势力侵害中华民族整体利益的帮凶,必遭唾弃

政知新媒体
2026-07-02 11:03:13
7月1日起信访新规:进京上访,须持省级“通行证”,否则不登记

7月1日起信访新规:进京上访,须持省级“通行证”,否则不登记

混沌录
2026-07-01 18:10:39
58岁周涛看彭冠英的眼神火了:端庄了一辈子,遇到帅哥也绷不住

58岁周涛看彭冠英的眼神火了:端庄了一辈子,遇到帅哥也绷不住

陈意小可爱
2026-07-02 03:07:25
随着美国2-0,世界杯16强诞生10席,非洲1队晋级,亚洲或全军覆没

随着美国2-0,世界杯16强诞生10席,非洲1队晋级,亚洲或全军覆没

绿茵舞着
2026-07-02 10:54:54
她预言了自己的死亡!!

她预言了自己的死亡!!

梳子姐
2026-07-01 20:01:45
曝西安赛格一商户老板严鹏跳楼身亡,原因曝光,四年前患上抑郁症

曝西安赛格一商户老板严鹏跳楼身亡,原因曝光,四年前患上抑郁症

180视角
2026-07-02 08:49:59
“穷尽其他送达方式后仍无法送达本通知”,清华大学一本科生被公告退学处理

“穷尽其他送达方式后仍无法送达本通知”,清华大学一本科生被公告退学处理

现代快报
2026-07-01 22:57:04
2026-07-02 13:00:49
字母榜 incentive-icons
字母榜
让未来不止于大。
2582文章数 8069关注度
往期回顾 全部

科技要闻

奥特曼的新算盘:给白宫5%股权 换政策绿灯

头条要闻

13名村民阻拦开采山体涉寻衅滋事:4人获刑 9人获国赔

头条要闻

13名村民阻拦开采山体涉寻衅滋事:4人获刑 9人获国赔

体育要闻

世界杯硬核球迷,把自己变成了雕像

娱乐要闻

霍震霆回应霍启山娜然结婚传闻

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

比亚迪26款海鸥,不到7万配激光雷达,官方还包赔?

态度原创

教育
亲子
艺术
数码
公开课

教育要闻

合肥理工学院今年计划招生多少人,官方解答来了(编辑:晨晨)

亲子要闻

日本老公给优奈新买了婴儿车,瞧把她给高兴的,抓着爸爸不撒手!

艺术要闻

光辉历程 时代丹青——庆祝中国共产党成立105周年美展 油画选

数码要闻

“内存厂战略合作伙伴”?游戏《CINDER CITY》最低需求32GB RAM

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版