网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌用3年踩坑：模型准确率92%，业务却亏了2000万

2026-04-13 10:01:10　来源: 薛定谔的BUG

北京举报

0

分享至

2021年，谷歌内部一个推荐模型在测试集上跑出92%的准确率。团队开了香槟，业务方签了字，三个月后项目被砍——因为用户实际点击率跌了17%。

这不是技术失败，是认知塌方。

数据科学家有个隐秘的骄傲：模型指标就是成绩单。R²从0.7涨到0.85，AUC突破0.9，这些数字在汇报会上自带光环。但光环照不到的地方，业务正在流血。

我见过最荒诞的案例：某金融公司的风控模型，训练时把"用户点击贷款广告"当成正样本。模型学得很聪明——它发现晚上9点刷短视频的人最容易冲动点击。上线后坏账率飙升，因为点击和还款能力完全是两回事。

指标幻觉：实验室里的皇帝新衣

问题出在反馈回路的设计。大多数模型优化的是「可观测的代理指标」，而非「真正的业务结果」。

推荐系统追求点击率，但点击后秒关的用户对平台毫无价值；客服机器人追求问题解决率，但把复杂问题标记为"已解决"只会逼用户打电话骂人。这些指标像体温计——能告诉你发烧了，但治不好病。

更隐蔽的是时间错位。历史数据训练出的模型，本质上是在复制过去。2020年教用户买口罩的推荐算法，2023年还在推N95——市场早就转向抗原试剂了。数据越"干净"，滞后性越致命。

Netflix在2019年做过一次残酷实验：把推荐模型的训练数据从6个月延长到2年，离线AUC提升了4.3%。上线后订阅流失率反而上升，因为老数据放大了过时的内容偏好。他们后来把数据窗口砍回90天，这是用真金白银买的教训。

因果陷阱：相关性的复仇

数据科学家容易掉进第二个坑：把相关性包装成因果。

某零售巨头发现，买婴儿床的客户同时高频购买啤酒。模型据此推送啤酒优惠券，转化率惨淡——因为真实场景是"准爸爸被派出来采购，顺手犒劳自己"。相关性成立，干预却失效，这是因果推断的经典陷阱。

Uber的定价团队吃过类似的亏。早期模型发现，雨天订单取消率低，于是建议雨天加价。实际上取消率低是因为用户别无选择，加价后司机供给没跟上，乘客直接转投Lyft。模型学到了表象，没学到弹性。

解决这类问题需要反事实思维：如果我没做这个推荐，用户会怎么做？但大多数A/B测试设计粗糙，对照组和实验组的差异被噪音淹没。更常见的是，业务方等不及6周的实验周期，"先上线再说"成了默认选项。

组织孤岛：谁为结果买单

最深层的问题不在技术，在权责结构。

数据科学家的KPI是模型准确率，业务方的KPI是营收增长。两个指标之间隔着翻译层，而翻译层往往由PPT构成。模型团队交付"完成"，业务团队接手"运营"，中间的断层没人负责。

Stripe的做法值得参考：他们的数据科学家必须轮岗客服。不是走形式，是真的接电话、处理退款纠纷。三个月后，这些人做特征工程时，会本能地问"这个变量用户自己知道吗"——因为被用户骂过。

Airbnb更激进。2018年他们拆掉了独立的"算法团队"，把数据科学家塞进产品组，汇报线跟着业务指标走。代价是技术深度下降，收益是模型上线后的迭代速度提升了3倍。这不是最优解，但承认了组织设计比算法更难优化。

回到谷歌那个被砍的项目。复盘时发现，92%准确率的秘密是模型过度拟合了测试集的时间戳特征——它其实在预测"用户是不是在周五晚上打开App"，而非"用户喜不喜欢这个内容"。周五晚上人本来就闲，点什么都多。

这个bug在交叉验证里完全隐身，因为时间戳被随机打乱了。直到业务方把模型按星期几分组测试，才发现周五的"优异表现"撑起了整体指标。

现在的数据科学面试题已经变了。不再是"怎么调参提升AUC"，而是"如果模型上线后业务指标下跌，你会怎么排查"。后者没有标准答案，但筛掉了把离线指标当终点的候选人。

一个正在发生的转变是：越来越多的公司把"模型撤销率"写进技术评审。上线三个月内被回滚的比例，比任何学术指标都诚实。某头部电商的这个数字是34%——意味着每三个模型就有一个在真实世界里翻车。

如果你今天还在用测试集AUC向老板汇报，建议补一道思考题：当模型预测用户会点击，而用户确实点击了，这中间的因果关系，你真的验证过吗？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

Anthropic把「龙虾之父」封了？145 万账号祭天，开发者怕了

雷科技 2026-04-12 20:26:45
17 跟贴 17
“马斯克版微信”真的来了！

华尔街见闻官方 2026-04-13 11:47:32
3 跟贴 3

早报｜马斯克版微信亮相App Store，周五开放下载/宇树机器人跑步刷新纪录，王兴兴：年内将超博尔特/海底捞回应员工自费500元买礼物

爱范儿 2026-04-13 11:48:32
0 跟贴 0

上周封杀OpenClaw，这次直接封杀创始人？Anthropic：误会已解封

机器之心Pro 2026-04-13 13:23:40
0 跟贴 0
全错！谷歌实锤AI越乖洗脑越深，现行安全指标沦为废纸

新智元 2026-04-13 12:06:49
0 跟贴 0

长生不老，谷歌让人活到150 岁？

蒋院长讲航天 2026-04-11 11:14:21
14 跟贴 14

AI打榜，打的是什么？

钛媒体APP 2026-04-12 09:31:25
0 跟贴 0
DeepSeek推理分裂出多重人格，越社交越聪明

量子位 2026-02-04 03:32:03
0 跟贴 0

Claude强到不敢发的Mythos，被质疑用了字节Seed技术

量子位 2026-04-13 13:48:38
0 跟贴 0
警惕！日本某些势力“定制”AI反华视频，用算法“加持”仇恨（来源：钧正平）

学申论的谈妹 2026-04-11 03:22:48
0 跟贴 0
国内首个！加入六维力的全感知数采，让VLA模型进化出力触觉

机器之心Pro 2026-04-13 14:16:50
1 跟贴 1
《心跳文学部》因涉及敏感主题遭谷歌商店下架

后竹游戏 2026-04-13 12:30:43
0 跟贴 0
「龙虾之父」吐槽人类互联网后，终于有人把这当个事儿办了

机器之心Pro 2026-03-31 11:09:26
0 跟贴 0
挤干大模型高分水分!最强模型仅49分,南大傅朝友发布Video-MME-v2

机器之心Pro 2026-04-13 10:12:23
0 跟贴 0
外卖骑手超速真相：75%准时率要靠违章换，算法把路权变成KPI

硅屿手记 2026-04-13 08:01:05
0 跟贴 0
乔丹哭成泪人：他偷走我所有技术，最后带走了我的一部分灵魂

白嫖的小知识 2026-04-12 10:36:52
1 跟贴 1
大模型的下半场，属于拥有云+AI全栈引擎的玩家

量子位 2026-01-30 03:29:45
0 跟贴 0
胡俊杰、吴佳俊、刘子纬等获奖，微软学者奖学金公布

机器之心Pro 2026-04-13 15:16:06
0 跟贴 0
内塔尼亚胡任命下任摩萨德负责人

环球网资讯 2026-04-13 06:48:07
1317 跟贴 1317
“不确定性”的终极集约：从神学盲盒到算法猎场

钛媒体APP 2026-04-13 14:53:50
0 跟贴 0
NUS邵林团队提出T(R,O) Grasp：刷新跨智能体灵巧抓取SOTA

机器之心Pro 2026-04-13 13:17:37
0 跟贴 0
人类首例“被恐龙咬伤事件”！男子把头伸进恐龙模型里被卡住，当事人：没想到它会不松口大家别跟我学 #

开屏新闻客户端 2026-04-11 18:04:45
12 跟贴 12
十万头猪的KPI：把中国第七大沙漠从黄色拱成绿色

深蓝航迹 2026-04-09 14:38:57
9 跟贴 9
山西闻喜一男子被狗咬伤辗转两接种点等待6小时才接种

封面新闻 2026-04-12 16:37:28
930 跟贴 930
数据加工的清理方式，这喷水是真的猛，一看就是专门设计的！

能把人笑没社 2026-04-11 15:27:30
1 跟贴 1
面对面丨专访张雪：20年，让世界看见中国制造

环球网资讯 2026-04-13 07:31:08
24 跟贴 24
外国人在中国用手势比划点餐，全障碍语言但无障碍沟通。网友：中文含量0%，沟通效率100%

中国日报网 2026-04-12 18:40:25
141 跟贴 141
售后想欺上瞒下？张雪：你明天不用来了！直接对话用户，重塑售后

搞笑草莓 2026-04-12 03:52:21
127 跟贴 127
这么自信？曝黑旗RE不跟索尼也不跟微软将单独发布

游民星空 2026-04-13 15:24:25
0 跟贴 0
最佳模仿秀，连衣服都要学上，这技术一般人可来不了这个

余温生活说 2026-04-13 10:41:25
0 跟贴 0
美国大姐怒骂政客，美版算法稀烂，都想换回中国算法

搞笑小哈皮 2026-04-10 00:00:00
0 跟贴 0
湖人巨星詹姆斯真是太讨厌刷数据了！

大黑爱旅游 2026-04-11 02:54:52
7 跟贴 7
充电按功率收服务费，充电算法引业主质疑

民生大参考 2026-04-11 02:16:05
0 跟贴 0
开创VLA的那帮人，正在抛弃VLA

机器之心Pro 2026-04-13 15:33:47
0 跟贴 0
中汽协公布2026年一季度车市数据：内销大跌，出海暴增

澎湃新闻 2026-04-13 11:10:18
62 跟贴 62
匈牙利蒂萨党在国会选举中获胜

环球网资讯 2026-04-13 06:59:05
0 跟贴 0
以军坦克在黎南部冲撞联黎部队意大利车辆

海外网 2026-04-13 07:32:01
278 跟贴 278
进口滴眼液，从700多元涨至3000多元？

中国新闻周刊 2026-04-12 21:11:07
357 跟贴 357
女子展示她的绝技将标记过的牌发给自己

蓬勃资讯 2026-04-12 14:15:31
1 跟贴 1
公厕两门都标记男厕所，昨天男子进去小便被女生挖脸，说他耍流氓

元气八眉菌 2026-04-13 03:09:13
0 跟贴 0

河南知名景区，一游客持大刀互动砸到演员头部，演员回应：是不小心误伤，打了破伤风针已恢复演出

河南知名景区，一游客持大刀互动砸到演员头部，演员回应：是不小心误伤，打了破伤风针已恢复演出

环球网资讯

2026-04-12 09:10:48

医生直言：体检报告这5项指标正常，身体基本上无大碍，建议了解

医生直言：体检报告这5项指标正常，身体基本上无大碍，建议了解

熊猫医学社

2026-04-03 11:35:03

美国总统特朗普：封锁伊朗后美国将能大卖石油

美国总统特朗普：封锁伊朗后美国将能大卖石油

财联社

2026-04-13 13:46:08

2026有线电视全面整改！这些收费全取消，再也别花冤枉钱！

2026有线电视全面整改！这些收费全取消，再也别花冤枉钱！

时尚的弄潮

2026-04-13 14:36:32

郑丽文的婚姻：女主外男主内，不生育孩子，事业理想置于家庭之上

郑丽文的婚姻：女主外男主内，不生育孩子，事业理想置于家庭之上

芳芳历史烩

2026-04-08 16:28:15

终究还是落槌了。内塔尼亚胡，这位在政坛翻云覆雨几十载的硬汉

终究还是落槌了。内塔尼亚胡，这位在政坛翻云覆雨几十载的硬汉

网络易不易

2026-04-13 11:03:04

22球18助！英媒：亚马尔已是足坛世界第1 超越同龄梅西C罗

22球18助！英媒：亚马尔已是足坛世界第1 超越同龄梅西C罗

叶青足球世界

2026-04-12 20:06:57

上海交大发现：不吃酱油和味精的人，血压马上就降低了？真的吗？

上海交大发现：不吃酱油和味精的人，血压马上就降低了？真的吗？

健康之光

2026-04-13 15:10:03

看金门如何融入厦门，解放台湾岛并不一定非得通过战争

看金门如何融入厦门，解放台湾岛并不一定非得通过战争

聆泉书斋

2026-04-05 23:11:16

以色列摩萨德局长换人，为白俄罗斯裔犹太人，任内塔尼亚胡军事秘书，总理办公室称他“极具声望”，批评者称他缺乏情报工作经验

以色列摩萨德局长换人，为白俄罗斯裔犹太人，任内塔尼亚胡军事秘书，总理办公室称他“极具声望”，批评者称他缺乏情报工作经验

极目新闻

2026-04-13 10:55:21

不踢球却统治足球！美国资本血洗欧洲足坛：百年规则，我说改就改

不踢球却统治足球！美国资本血洗欧洲足坛：百年规则，我说改就改

曾蠃爱旅行

2026-04-13 07:40:22

全红婵事件最新！嫌疑人被抓，央视曝处罚结果，牵连人员真相大白

全红婵事件最新！嫌疑人被抓，央视曝处罚结果，牵连人员真相大白

朗威谈星座

2026-04-13 09:06:11

案例：北大女博士倒挂长城2个小时，目睹老公劈死，自己坠崖而亡

案例：北大女博士倒挂长城2个小时，目睹老公劈死，自己坠崖而亡

清茶浅谈

2025-01-14 18:01:31

朝鲜战争期间：美军原来已接近击败中国，却碰上中国决死的指挥官

朝鲜战争期间：美军原来已接近击败中国，却碰上中国决死的指挥官

最美的巧合

2026-04-12 10:36:36

42岁文章开饭店！亲自迎客端菜，微笑热情

42岁文章开饭店！亲自迎客端菜，微笑热情

三言科技

2026-04-13 09:47:12

特朗普紧急下令，美军即将行动，以色列深夜开火，伊朗要小心了

特朗普紧急下令，美军即将行动，以色列深夜开火，伊朗要小心了

南宗历史

2026-04-13 14:56:39

沙特能源大动脉迅速“止血”：东西向输油管道恢复满负荷运行

沙特能源大动脉迅速“止血”：东西向输油管道恢复满负荷运行

财联社

2026-04-13 12:50:10

宇航员从太空回望地球，为什么会感到恐惧，他们看到了什么？

宇航员从太空回望地球，为什么会感到恐惧，他们看到了什么？

观察宇宙

2026-04-13 09:28:52

白人女性与黑人女性的体味差异，网友真实分享引发热议

白人女性与黑人女性的体味差异，网友真实分享引发热议

特约前排观众

2025-12-22 00:20:06

项立刚微博被禁言，易中天获厦大杰出贡献奖

项立刚微博被禁言，易中天获厦大杰出贡献奖

难得君

2026-04-09 16:02:49

薛定谔的BUG

有态度网友ytd

1313文章数 35关注度

往期回顾全部

科技要闻

传荣耀与字节跳动接洽“豆包手机”合作

头条要闻

女子名下多出一套上海房产很苦恼：丈夫去世房子没了

头条要闻

女子名下多出一套上海房产很苦恼：丈夫去世房子没了

体育要闻

一支球队不够烂，也是一种悲哀

娱乐要闻

贾玲减重后现身冯巩生日宴身材未反弹

财经要闻

起底AI"造黄"灰产：19.9元"一键脱衣"

汽车要闻

不止命名更纯粹领克10/10+要做纯电操控新王

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

数码

家居

时尚

房产

公开课

数码要闻

高管亲自放风何刚暗示华为 WATCH FIT 5 Pro即将发布

家居要闻

复古风格自然简约

这些才是普通人借鉴的穿搭！上短下长、上窄下宽，显瘦又舒适

房产要闻

6000亿投资盛宴，全球巨头齐聚，海南又要干件大事！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版