“企业的AI预算,一个月、两个月就见底了,而这可是全年的预算。”企业AI公司Glean首席执行官阿尔温德·贾因(Arvind Jain)对CNBC说出这番话时,语气并不轻松。他正在描绘一个正在《财富》500强公司内部悄然发生的残酷现实:人工智能的开销正以一种谁也没料到的速度吞噬着企业钱包,进而逼出一个前所未有的选择题——要“代币”(token),还是要人?
这不是一个比喻。当一枚前沿大模型生成的每一个“代币”成本都在翻倍上涨,当企业发现用在AI上的钱已经和雇一个人差不多时,那个“技术永远比人便宜”的旧信条就开始崩塌了。贾因说,在他记忆里,这是第一次出现“技术成本和人力成本持平”的时刻,企业不得不开始计算:同样的钱,到底是多烧几个token,还是多招几个人?
![]()
而答案,已经开始指向对未来员工增长的牺牲。“这些越来越庞大的AI预算,正在取代未来的人力增长。”贾因直言。这背后的推手,正是AI模型价格不降反升的诡异走势——每一代新模型,单位token成本几乎是上一代的两倍。贾因甚至直接用了“不可持续”这个词来描述当前的路径。
在这场算力与工资单的博弈中,另一个关键角色——Factory AI的首席执行官马坦·格林伯格(Matan Grinberg)也给出了相似的诊断。他把这场风波看成一个“资源分配的难题”,正在领导团队的会议室里激烈上演。“公司会说,嘿,如果我们只能优化一件事,那到底是优化我们拥有的员工数量,还是优化每个员工身上的AI花费?”格林伯格说道。这个问题的提出本身,已足够说明AI早已不是那个躲在成本表小数位里的廉价工具了。
那么,企业们是怎么一步步把自己推到这条“烧钱高速”上的呢?格林伯格勾勒出了一条清晰的三年快进线。第一阶段,董事会急迫地命令CEO“做点儿AI相关的事”,于是风风火火的探索开始了。第二阶段,一种被称为“tokenmaxxing”的行为模式出现——不问成本、只求成果,能用的AI全用上,先把所有前沿模型灌进业务流程再说。而现在,他们进入了第三阶段:捂住钱袋子,重新审视需求。“我们真的需要每一个任务都用到Opus级别的智能吗?”格林伯格发问,“你根本就没必要。”
这个问句戳中了一个更大的麻烦:技术确实强大,但它还没能自己养活自己。贾因点出了核心矛盾:“AI目前的工作方式,非常强大,但也非常低效。AI驱动的价值,此刻是落后于企业正在承担的成本的。”也就是说,花出去的钱,还没等来对等的回报,那个财务模型下的剪刀差正在越张越大。
更令人咋舌的浪费还在后面。贾因抛出了一个惊人的数字:大约95%的企业AI使用,仍然跑在最昂贵的那批前沿模型上,即便很多任务压根用不上如此奢侈的算力。这就好比你每天点米其林三星外卖,却只是想吃碗白粥——不是不行,但账单足够烧穿任何一家公司的预算表。而那个最轻易就能摘到的“低垂果实”,恰恰就藏在这里:把简单工作路由到更便宜的模型上去。
贾因给出的方案听起来简单得不可思议:“只要在前端做好模型路由,你就能实现10倍的成本节省。”没错,十倍的节省,不靠裁人,不靠砍业务,只靠把交给顶级大脑的简单问题,转手丢给它那些更轻量、更便宜的“学弟学妹”们。这或许是当前企业AI预算危机中最直接、也最被低估的解药。
如果把这个故事抽丝剥茧,它其实已经画出了一条从疯狂撒钱到理性算计的抛物线。起初,因为害怕落后,企业把前沿模型当成万灵药,不惜成本地all-in;接着,在“tokenmaxxing”的快感中,消费变得毫无节制;最后,当第一张超额账单摆在CFO桌上时,全员才猛然惊醒——原来AI不是免费的电力,它是昂贵的“大脑”,用多少、怎么用,都有明码标价,而且比雇一个同样能干的人还贵。
于是,那句“要代币还是要人”就不再是个隐喻,而是一道真实出现在企业决策表格里的选填项。在技术照进现实的过程中,每多烧一个昂贵的token,就意味着未来少招一个可能同样产出价值的员工。这个刚刚被推上台面的公式,也许比任何一篇AI技术论文都更能让人们看清,人工智能这场盛宴的真正成本到底是谁在买单。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.