零售史上最著名的都市传说,大概要数"啤酒与尿布"。故事说沃尔玛发现年轻爸爸买尿布时顺手带啤酒,于是把两者摆在一起,销量暴涨。这个案例被写进无数数据挖掘教材,用来解释关联规则学习——但很少有人追问:这事到底发生过吗?
真相有点尴尬。1992年《福布斯》杂志首次提到这个案例,说是Tesco在英国的发现。后来版本几经转手,主角变成沃尔玛,地点挪到美国,细节越来越丰富。数据科学家Daniel Powers 2002年撰文追溯,发现原始来源早已不可考。换句话说,这可能是个被反复传抄的"商业寓言"。
但算法本身是真的。关联规则学习的核心就三个数字:支持度(同时出现的频率)、置信度(买了A的人多大比例买B)、提升度(两者关联是否强于随机)。Apriori算法1994年提出后,迅速成为购物篮分析的标配。亚马逊的"买了X的人也买了Y"、Netflix的推荐列表,底层都是这套逻辑。
问题在于,算法输出的是相关性,不是因果。啤酒和尿布可能确实常一起出现——但也许是因为两者都是周末傍晚的畅销品,而不是因为新手爸爸的"刚需组合"。强行摆在一起,未必有奇效。
这个故事的流传本身倒是值得玩味。人们需要具体的、反直觉的案例来理解抽象技术,哪怕细节失真。一位零售分析师的评价很到位:「关联规则不会告诉你为什么,它只告诉你'这俩常一起卖',解释因果是人的工作。」
如今沃尔玛官网的"数据科学故事"页面,已经找不到啤酒与尿布的案例了。但每年仍有成千上万的学生,在课本里读到这个"经典案例",然后信心满满地走进面试考场。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.