三年前企业买AI像买彩票,演示时天花乱坠,落地时一地鸡毛。销售拍胸脯说"这模型能写代码",结果程序员用起来发现它连自家API文档都认错,气得直接回滚到人工。
现在风向变了。客户不再问"你能做什么",而是问"你保证不做什么"——比如保证不 hallucinate 价格、不擅自调用敏感接口、不在财报季突然宕机。可靠性成了新的护城河,花哨功能反而成了减分项。
一位CIO的原话很扎心:「我们淘汰了三家 vendor,不是因为它们不够聪明,是因为它们聪明得太随机。」翻译一下:模型输出不稳定,比输出平庸更致命。业务线要的是可预期的 80 分,不是摇奖式的 95 分或 40 分。
供应商的应对也很现实。以前发布会堆 benchmark 数字,现在合同里写 SLA 赔付条款。某头部厂商甚至把"幻觉率"写进对赌协议——超标一分,赔款翻倍。这相当于从卖艺的变成卖保险的,姿态难看,但生意稳了。
最讽刺的是用户端的反馈。早期 adopters 抱怨"AI 不够智能",现在同一批人抱怨"同一个问题两次答案不一样"。需求从"更聪明"滑向"更可预测",像是从期待天才员工转向期待靠谱老员工——不出彩,但不出错。
一位部署了 18 个月的企业客户说,他们现在评估模型的核心指标只有一个:连续 30 天无人工干预的自动化任务完成率。数字不好看?再强的生成能力也白搭。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.