近期又是各大商超促销扎推的时候了,不知道大家在买东西的时候是不是也有这样的体会,好多捆绑促销简直就是“绑”到我心坎里,商品的边上刚好是没有计划却也能顺手买下的东西……今天小朱老师就从一个简单的亲和性案例进入,带大家掌握关联规则分析的启蒙知识。告诉你这些商家促销的“小心机”。
什么是亲和性分析
亲和性本身用来判断样本数据相似度的一种数据挖掘方法,一般的使用场景如下:
- 对网站的用户开展新的业务或者定向投放广告
- 销售商品的时候推荐相关或者你喜欢的商品
亲和性分析有个最著名的案例就是:啤酒与尿布的故事
原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的啤酒(由此看出美国人爱喝酒)。商家通过对一年多的原始交易记录进行详细的分析,发现了这对神奇的组合。于是就毫不犹豫地将尿布与啤酒摆放在一起售卖,通过它们的关联性,互相促进销售。“啤酒与尿布”的故事一度是营销界的神话。
为了方便大家理解,在今天的案例中我们只看两件商品同时购买的情况:
用户在购买商品A的同时更倾向于购买商品B
支持度是规则在数据集中出现的次数,即匹配规则的样本数,比如同时购买商品X和Y的交易数;
置信度是衡量匹配规则的准确度的,比如在购买商品X的交易中同时购买商品Y的比例。
首先做数据准备
这边大家可以自己使用随机函数构建数据,代码如下:
可以看到这组数组数据比较小,只有200行5列数据,但是足够用了,这里每一行的数据我们都可以看做是一次交易行为,1代表买了这款商品,0代表没有买。
我们先将这五列分别对应一款商品:橙子,草莓,香蕉,苹果,面包。那么数据的第一行代表的意思就是没有购买香蕉和苹果。
这里我们就先来看看苹果对面包的亲和性。根据概念,置信度需要知道支持度中某商品交易次数,这里我们拿面包举例,看看看出现的次数。
首先查看苹果出现的次数:
计算出来以后我们就可以算出苹果对面包的置信度:用苹果对面包的支持度/含苹果的交易数。
我们算出苹果对面包的支持度为47,也就是同时出现的交易次数是47,而购买苹果同时购买面包的人有48%,也就是置信度是48%。
到这一步我们就需要计算数据当中所有的规则了,当然还是以两个商品组合为例。
最终的结果为:
然后我们可以输出置信度TOP5的规则,看看是那些产品组合。
可以看到四种产品相对于面包的置信度都是最高的,那我们就可以推出购买四种水果面包可以打折之类的促销活动。
大家可以自己制作数据尝试一下亲和性的分析,后续关联性分析小朱老师再跟大家来探讨如何优化算法。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.