网易首页 > 网易号 > 正文 申请入驻

阿里/网易/美团/58用户画像中的ID体系建设

0
分享至

编辑导语:上篇文章中作者介绍了关于标签构建的业务和需求,建立用户画像分两侧来进行,用户画像体系偏战略和应用,标签分类偏管理和技术实现侧;本文作者分享了关于几大企业里关于ID体系建设的分析,我们一起来看一下。

在《标签构建过程中,如何快速盘点业务及数据需求?》梳理完标签画像体系的业务需求后,索隆开始了对画像体系的整体设计,其中首要遇到的就是用户ID体系的打通相关的问题。

公司各业务线ID繁多,数据割裂,如何才能尽可能关联更多的数据,以准确的描绘出一个用户的画像呢?

接下来我们来看看索隆通过对界内科技巨头:阿里、网易、美团、58的调研分析,来一步步建立自己公司的ID-Mapping体系的过程。

一、阿里OneID

阿里巴巴作为一家包含多条业务线的公司,如电商、金融、广告、文化、教育、娱乐、设备和社交等领域,数据区域包含国内、国外;数据场景包含线上的人货场钱、线下的人货场钱位置等数据,以及物流、用餐、咨询、影视、出行、阅读、音乐和健康等相关数据。

ID类型包含phone、PC cookie、IMEI与IDFA、淘宝账户、支付宝账户、邮箱等。

而对于每个BU来说,他们知道的只是这个客户的片面属性,在开展营销活动时,只是针对一个手机号或一个邮箱做营销,但背后不能识别出来一个自然人、一个公司。

为打破数据孤岛,创造更大的数据价值,阿里使用OneData作为核心方法论。

OneData体系包含:

  • OneModel:数据资产构建与管理;
  • OneID:实体打通和画像;
  • OneService:逻辑化服务;

OneID基于超强ID识别技术链接数据,高效生产标签;业务驱动技术价值化,消除数据孤岛,提升数据质量,提升数据价值;而ID的打通,必须有ID-ID之间的两两映射打通关系,通过ID映射关系表,才能将多种ID之间的关联打通,完全孤立的两种ID是无法打通的。

打通整个ID体系,看似简单,实则计算复杂,计算量非常大;假如某种对象有数亿个个体,每个个体又有数十种不同的ID标识,任意两种ID之间都有可能打通关系,想要完成这类对象的所有个体ID打通需要数亿次计算,一般的机器甚至大数据集群都无法完成。

大数据领域中的ID-Mapping技术就是用机器学习算法类来取代野蛮计算,解决对象数据打通的问题;基于输入的ID关系对,利用机器学习算法做稳定性和收敛性计算,输出关系稳定的ID关系对,并生成一个UID作为唯一识别该对象的标识码。

二、网易ID-Mapping

网易产品线有网易云音乐、网易邮箱、网易新闻、网易严选等,不同应用上有不同的ID,如yanxuanid、oaid、musicid、phone、email、idfa、imei等。

要想标识唯一ID,网易采用的思路及方案为:结合各种账户、各种设备型号之间的关系对,以及设备使用规律等用户数据;采用规则规律、数据挖掘算法(连通图划分+社区发现)的方法,判别账户是否属于同一个人。

ID-Mapping过程中,常遇到的问题及对应方案如下:

问题一:用户有多个设备信息。

解决方案:定义相关的阈值进行关联,社区发现当前应用于营销场景,暂未用于风控或用户运营场景;因为这种方式会把一些异常的账号关联在一起,且会存在仅登录使用过一次的设备信息。

问题二:设备过期,一般是2年半左右时间。

解决方案:设定衰减系数,对单用户多设备加大衰减力度。

备注:通常一人多设备对应的场景有:借用朋友设备、设备脏数据、刷号等。

三、58 ID-Mapping

58业务场景丰富,其产品线包含58同城、赶集、安居客、中华英才网、转转、58到家等。

在这种多用户、多业务线、多子公司的情况下,用户数据种类繁杂,构建画像的数据来自于日志、简历库、帖子库、用户信息库、商家库、认证信息库等数据源;其中仅日志就涉及到58、赶集、安居客等各个子产品的PC/M/APP日志。

如何将众多数据源串联起来是构建用户画像面临的第一个问题,如下是58构建的ID-Mapping模型图:

从图中可以看出,不同业务线所拥有的ID标识不一:

  • 58同城:wuser、wbdid、wimei;
  • 58赶集:guser、gbdid、gapud、gimei;
  • 安居客:kimei;

其中可以通过telep、bidua、appua、imei、idfa关联起来,由此建立不同ID之间的关联映射关系,就是ID-Mapping的过程。

四、美团ID-Mapping

美团与大众点评进行了合并,那同一个用户在两个APP上有不同的身份标识,美团要怎样进行唯一标识呢?

我们来看看美团和大众点评的账号体系,美团采用手机号、微信、微博、美团账号的登录方式;大众点评采用的手机号、微信、QQ、微博的登录方式;其交集为手机号、微信、微博。

最终,对于注册用户账户体系,美团采用了手机号作为用户的唯一标识。

五、总结

从上述案例可看出,ID-Mapping有三种常见方法:

  • 基于账号体系企业中最常用的是基于账号体系来做ID的打通,用户注册时,给到用户一个uid,以uid来强关联所有注册用户的信息。
  • 基于设备:那对于未注册用户可以通过终端设备ID精准识别,包含Android/iOS两类主流终端的识别;通过SDK将各种ID采集上报,后台利用的ID关系库和校准算法,实时生成/找回终端唯一ID并下发。
  • 基于账号&设备:结合各种账户、各种设备型号之间的关系对,以及设备使用规律等用户数据;采用规则规律、数据挖掘算法的方法,输出关系稳定的ID关系对,并生成一个UID作为唯一识别该对象的标识码。

六、实践

1)梳理业务及数据现状由于公司包含租住、生活服务等多条业务线,不同业务的用户标识不一;数据来源各不相同,数据散落在各业务表中,ID标识包含phone、邮箱、神策ID、cuid、IMEI、idfa等。

2)明确建设目标:ID-Mapping体系的建立,旨在打破数据孤岛,将更多用户的数据关联起来,形成全域用户画像,帮助营销人员进行精细化营销。

3)制定项目计划:

第一阶段:基于用户账号体系,用phone关联注册用户的ID,维护一个ID映射库,统计注册用户线上线下行为数据。

第二阶段:基于设备,用device ID关联未注册用户的ID,统计未注册用户的行为数据。

第三阶段:基于账号&设备,采用数据挖掘算法做ID映射。

4)按计划进行

接下来要做的就是按计划开展项目。这个过程中,注意要点在于,基于公司的数据现状出发,一步步实施;梳理清楚底层数据表中的ID标识;理清楚各ID之间的关系图,便于做映射。

作者:草帽小子;公众号:一个数据人的自留地,wx:luckily304

本文由 @草帽小子 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

给作者打赏,鼓励TA抓紧创作!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
0-3崩盘!十人迈阿密2连败净丢6球,梅西勺子点球被扑+妙传遭吐饼

0-3崩盘!十人迈阿密2连败净丢6球,梅西勺子点球被扑+妙传遭吐饼

我爱英超
2025-09-14 09:38:46
香飘飘紧急公告:暂停绕地球

香飘飘紧急公告:暂停绕地球

中国基金报
2025-09-13 23:15:27
借你丈夫用用!山西女子向闺蜜借丈夫一用,并承诺会给10万感谢费

借你丈夫用用!山西女子向闺蜜借丈夫一用,并承诺会给10万感谢费

百态人间
2025-09-13 16:15:30
27年的等待结束?挪威最快下个月进世界杯!需取胜+意大利2轮不胜

27年的等待结束?挪威最快下个月进世界杯!需取胜+意大利2轮不胜

直播吧
2025-09-13 10:53:53
西贝这波操作真刑!后厨戴金表炒菜,来炫富还是忘了自己是干啥的

西贝这波操作真刑!后厨戴金表炒菜,来炫富还是忘了自己是干啥的

做一个合格的吃瓜群众
2025-09-14 07:23:03
姆巴佩挡不住!断球反击一条龙,4场4球领跑射手榜,3战皇社入3球

姆巴佩挡不住!断球反击一条龙,4场4球领跑射手榜,3战皇社入3球

奥拜尔
2025-09-13 22:38:24
派出所回应于朦胧坠楼,被资本封杀3年零收入,3个月前新剧刚杀青

派出所回应于朦胧坠楼,被资本封杀3年零收入,3个月前新剧刚杀青

新金牌娱乐观察家
2025-09-11 12:48:42
西贝门店回应“罗永浩吐槽西兰花保质期2年”:冷冻锁鲜保存的有机花菜,进后厨参观需持健康证

西贝门店回应“罗永浩吐槽西兰花保质期2年”:冷冻锁鲜保存的有机花菜,进后厨参观需持健康证

极目新闻
2025-09-13 16:35:02
华尔街华裔从47楼跳下,账户余额7500万,遗言:对不起

华尔街华裔从47楼跳下,账户余额7500万,遗言:对不起

徐侠客有话说
2025-09-12 10:36:01
4-3!补时绝杀 一场4记世界波 兄弟同场破门 国家德比戏剧性拉满

4-3!补时绝杀 一场4记世界波 兄弟同场破门 国家德比戏剧性拉满

狍子歪解体坛
2025-09-14 02:06:26
“日本最强中国功夫”女播音员公开了自己最新的旗袍照片,引热议

“日本最强中国功夫”女播音员公开了自己最新的旗袍照片,引热议

随波荡漾的漂流瓶
2025-09-13 16:50:20
夜跑穿搭太抢眼?看效果就知道!

夜跑穿搭太抢眼?看效果就知道!

独角showing
2025-09-05 08:50:22
马斯克变性女儿薇薇安纽约时装周首次登台走秀

马斯克变性女儿薇薇安纽约时装周首次登台走秀

奇闻不要看
2025-09-13 15:14:41
彪悍那英,大女人与旧妻子

彪悍那英,大女人与旧妻子

严肃八卦
2025-09-13 22:36:19
抖音网红千千万,无忧传媒占一半,盘点无忧传媒旗下10大网红

抖音网红千千万,无忧传媒占一半,盘点无忧传媒旗下10大网红

我不是博士
2025-09-11 17:13:29
大快人心!南京理工大学开学典礼硬刚极端女权,打响高校第一枪

大快人心!南京理工大学开学典礼硬刚极端女权,打响高校第一枪

明月杂谈
2025-09-12 18:19:09
叶剑英从未当过战役军团主官,很少指挥打仗,为何还能被授元帅?

叶剑英从未当过战役军团主官,很少指挥打仗,为何还能被授元帅?

史座y
2025-09-13 17:13:30
3克就致死?2010年,浙江男子为母亲治病试吃1克,嘴烂了

3克就致死?2010年,浙江男子为母亲治病试吃1克,嘴烂了

万象硬核本尊
2025-09-12 19:43:18
有什么脸怼西贝?当自己是外宾啊?

有什么脸怼西贝?当自己是外宾啊?

记忆承载
2025-09-13 14:55:22
取代马丁内利!阿森纳新10号太亮眼:3次过人+助攻哲凯,上位主力

取代马丁内利!阿森纳新10号太亮眼:3次过人+助攻哲凯,上位主力

球场没跑道
2025-09-13 22:45:07
2025-09-14 11:36:49
人人都是产品经理社区 incentive-icons
人人都是产品经理社区
想要成为大牛先从学做产品开始
63897文章数 311467关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

知名女演员离婚连发9条微博 为挽救婚姻做过亲子鉴定

头条要闻

知名女演员离婚连发9条微博 为挽救婚姻做过亲子鉴定

体育要闻

27年的等待结束?挪威最快下个月进世界杯

娱乐要闻

杨幂回复祝福区别对待祝绪丹引热议

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

亲子
艺术
时尚
旅游
教育

亲子要闻

我家的皮夹克没有漏风

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

衣服“买精不买多”,日常准备这几款单品,简单舒适又大方

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

教育要闻

小学五年级压轴题目,全班只有两名同学做对,太难了

无障碍浏览 进入关怀版