网易首页 > 网易号 > 正文 申请入驻

阿里/网易/美团/58用户画像中的ID体系建设

0
分享至

编辑导语:上篇文章中作者介绍了关于标签构建的业务和需求,建立用户画像分两侧来进行,用户画像体系偏战略和应用,标签分类偏管理和技术实现侧;本文作者分享了关于几大企业里关于ID体系建设的分析,我们一起来看一下。

在《标签构建过程中,如何快速盘点业务及数据需求?》梳理完标签画像体系的业务需求后,索隆开始了对画像体系的整体设计,其中首要遇到的就是用户ID体系的打通相关的问题。

公司各业务线ID繁多,数据割裂,如何才能尽可能关联更多的数据,以准确的描绘出一个用户的画像呢?

接下来我们来看看索隆通过对界内科技巨头:阿里、网易、美团、58的调研分析,来一步步建立自己公司的ID-Mapping体系的过程。

一、阿里OneID

阿里巴巴作为一家包含多条业务线的公司,如电商、金融、广告、文化、教育、娱乐、设备和社交等领域,数据区域包含国内、国外;数据场景包含线上的人货场钱、线下的人货场钱位置等数据,以及物流、用餐、咨询、影视、出行、阅读、音乐和健康等相关数据。

ID类型包含phone、PC cookie、IMEI与IDFA、淘宝账户、支付宝账户、邮箱等。

而对于每个BU来说,他们知道的只是这个客户的片面属性,在开展营销活动时,只是针对一个手机号或一个邮箱做营销,但背后不能识别出来一个自然人、一个公司。

为打破数据孤岛,创造更大的数据价值,阿里使用OneData作为核心方法论。

OneData体系包含:

  • OneModel:数据资产构建与管理;
  • OneID:实体打通和画像;
  • OneService:逻辑化服务;

OneID基于超强ID识别技术链接数据,高效生产标签;业务驱动技术价值化,消除数据孤岛,提升数据质量,提升数据价值;而ID的打通,必须有ID-ID之间的两两映射打通关系,通过ID映射关系表,才能将多种ID之间的关联打通,完全孤立的两种ID是无法打通的。

打通整个ID体系,看似简单,实则计算复杂,计算量非常大;假如某种对象有数亿个个体,每个个体又有数十种不同的ID标识,任意两种ID之间都有可能打通关系,想要完成这类对象的所有个体ID打通需要数亿次计算,一般的机器甚至大数据集群都无法完成。

大数据领域中的ID-Mapping技术就是用机器学习算法类来取代野蛮计算,解决对象数据打通的问题;基于输入的ID关系对,利用机器学习算法做稳定性和收敛性计算,输出关系稳定的ID关系对,并生成一个UID作为唯一识别该对象的标识码。

二、网易ID-Mapping

网易产品线有网易云音乐、网易邮箱、网易新闻、网易严选等,不同应用上有不同的ID,如yanxuanid、oaid、musicid、phone、email、idfa、imei等。

要想标识唯一ID,网易采用的思路及方案为:结合各种账户、各种设备型号之间的关系对,以及设备使用规律等用户数据;采用规则规律、数据挖掘算法(连通图划分+社区发现)的方法,判别账户是否属于同一个人。

ID-Mapping过程中,常遇到的问题及对应方案如下:

问题一:用户有多个设备信息。

解决方案:定义相关的阈值进行关联,社区发现当前应用于营销场景,暂未用于风控或用户运营场景;因为这种方式会把一些异常的账号关联在一起,且会存在仅登录使用过一次的设备信息。

问题二:设备过期,一般是2年半左右时间。

解决方案:设定衰减系数,对单用户多设备加大衰减力度。

备注:通常一人多设备对应的场景有:借用朋友设备、设备脏数据、刷号等。

三、58 ID-Mapping

58业务场景丰富,其产品线包含58同城、赶集、安居客、中华英才网、转转、58到家等。

在这种多用户、多业务线、多子公司的情况下,用户数据种类繁杂,构建画像的数据来自于日志、简历库、帖子库、用户信息库、商家库、认证信息库等数据源;其中仅日志就涉及到58、赶集、安居客等各个子产品的PC/M/APP日志。

如何将众多数据源串联起来是构建用户画像面临的第一个问题,如下是58构建的ID-Mapping模型图:

从图中可以看出,不同业务线所拥有的ID标识不一:

  • 58同城:wuser、wbdid、wimei;
  • 58赶集:guser、gbdid、gapud、gimei;
  • 安居客:kimei;

其中可以通过telep、bidua、appua、imei、idfa关联起来,由此建立不同ID之间的关联映射关系,就是ID-Mapping的过程。

四、美团ID-Mapping

美团与大众点评进行了合并,那同一个用户在两个APP上有不同的身份标识,美团要怎样进行唯一标识呢?

我们来看看美团和大众点评的账号体系,美团采用手机号、微信、微博、美团账号的登录方式;大众点评采用的手机号、微信、QQ、微博的登录方式;其交集为手机号、微信、微博。

最终,对于注册用户账户体系,美团采用了手机号作为用户的唯一标识。

五、总结

从上述案例可看出,ID-Mapping有三种常见方法:

  • 基于账号体系企业中最常用的是基于账号体系来做ID的打通,用户注册时,给到用户一个uid,以uid来强关联所有注册用户的信息。
  • 基于设备:那对于未注册用户可以通过终端设备ID精准识别,包含Android/iOS两类主流终端的识别;通过SDK将各种ID采集上报,后台利用的ID关系库和校准算法,实时生成/找回终端唯一ID并下发。
  • 基于账号&设备:结合各种账户、各种设备型号之间的关系对,以及设备使用规律等用户数据;采用规则规律、数据挖掘算法的方法,输出关系稳定的ID关系对,并生成一个UID作为唯一识别该对象的标识码。

六、实践

1)梳理业务及数据现状由于公司包含租住、生活服务等多条业务线,不同业务的用户标识不一;数据来源各不相同,数据散落在各业务表中,ID标识包含phone、邮箱、神策ID、cuid、IMEI、idfa等。

2)明确建设目标:ID-Mapping体系的建立,旨在打破数据孤岛,将更多用户的数据关联起来,形成全域用户画像,帮助营销人员进行精细化营销。

3)制定项目计划:

第一阶段:基于用户账号体系,用phone关联注册用户的ID,维护一个ID映射库,统计注册用户线上线下行为数据。

第二阶段:基于设备,用device ID关联未注册用户的ID,统计未注册用户的行为数据。

第三阶段:基于账号&设备,采用数据挖掘算法做ID映射。

4)按计划进行

接下来要做的就是按计划开展项目。这个过程中,注意要点在于,基于公司的数据现状出发,一步步实施;梳理清楚底层数据表中的ID标识;理清楚各ID之间的关系图,便于做映射。

作者:草帽小子;公众号:一个数据人的自留地,wx:luckily304

本文由 @草帽小子 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

给作者打赏,鼓励TA抓紧创作!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中医倪海厦:人可以节约,可以不买衣服,甚至吃差点,不修边幅都可以,但一定要出门,不要将自己困在家里,只有在外面......

中医倪海厦:人可以节约,可以不买衣服,甚至吃差点,不修边幅都可以,但一定要出门,不要将自己困在家里,只有在外面......

背包旅行
2026-06-11 15:09:42
荣耀CEO李健官宣正式签约张雪机车车队两位车手

荣耀CEO李健官宣正式签约张雪机车车队两位车手

CNMO科技
2026-06-12 12:36:26
再贵也要吃!端午前正大量上市,润肺排毒还杀菌,错过真可惜了

再贵也要吃!端午前正大量上市,润肺排毒还杀菌,错过真可惜了

江江食研社
2026-06-11 15:50:13
美加墨世界杯,央视体育频道主持是她,95后才入职2年接班马凡舒

美加墨世界杯,央视体育频道主持是她,95后才入职2年接班马凡舒

冷紫葉
2026-06-12 20:31:53
贝尔服了!你可以成为最强,但成不了梅西,因为他早已超越了最好

贝尔服了!你可以成为最强,但成不了梅西,因为他早已超越了最好

体育闲话说
2026-06-12 06:34:41
1952年,胡志明请求我国出兵援越,毛主席大怒:不出兵,这是原则

1952年,胡志明请求我国出兵援越,毛主席大怒:不出兵,这是原则

北海史记
2026-06-12 06:07:24
百余名老人被骗上千万元 北京捣毁20余家“套路养生馆”

百余名老人被骗上千万元 北京捣毁20余家“套路养生馆”

环球网资讯
2026-06-12 13:15:11
一汽奥迪A5L预售,25.68万起,比上汽奥迪便宜就行

一汽奥迪A5L预售,25.68万起,比上汽奥迪便宜就行

车动态
2025-07-21 17:42:38
谷歌母公司或为SpaceX上市最大隐形�...

谷歌母公司或为SpaceX上市最大隐形�...

新浪财经
2026-06-12 21:00:55
胃癌手术变“捉妖”?医生从70岁大伯胃里,夹出一根2厘米长的“硬货”!

胃癌手术变“捉妖”?医生从70岁大伯胃里,夹出一根2厘米长的“硬货”!

环球网资讯
2026-06-07 09:47:08
美取消已签波音大豆订单,188家中企在列

美取消已签波音大豆订单,188家中企在列

老塕是个手艺人
2026-06-09 17:37:28
办世界杯竟成烫手山芋,2030年仅两个申办国,为啥没人抢?

办世界杯竟成烫手山芋,2030年仅两个申办国,为啥没人抢?

叹为观止易
2026-06-08 14:22:53
王楚钦谈马龙等国乒名将现场助阵:很新鲜,之前都坐场下现在坐场边

王楚钦谈马龙等国乒名将现场助阵:很新鲜,之前都坐场下现在坐场边

懂球帝
2026-05-05 19:29:05
瀑布秋千绳索断裂致游客坠亡,四川华蓥:涉事公园已停业整顿

瀑布秋千绳索断裂致游客坠亡,四川华蓥:涉事公园已停业整顿

界面新闻
2026-05-05 20:05:10
今晚《歌手2026》六人补位,万妮达刘惜君杨坤张远领衔,三人淘汰

今晚《歌手2026》六人补位,万妮达刘惜君杨坤张远领衔,三人淘汰

东方不败然多多
2026-06-12 18:17:08
一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

路医生健康科普
2026-05-31 20:15:03
女游客体验瀑布秋千受伤后不幸身亡,涉事的广安华蓥景区系网红打卡地

女游客体验瀑布秋千受伤后不幸身亡,涉事的广安华蓥景区系网红打卡地

极目新闻
2026-05-05 20:45:29
000911,被证监会立案!

000911,被证监会立案!

证券时报e公司
2026-06-12 18:43:32
赖昌星的“红楼”有多厉害?官员坦白:享受全套服务,没人能把持

赖昌星的“红楼”有多厉害?官员坦白:享受全套服务,没人能把持

流史岁月
2026-06-12 11:04:38
李想:明天起全新理想L8进入全国门店

李想:明天起全新理想L8进入全国门店

IT之家
2026-06-12 12:01:07
2026-06-12 23:12:49
人人都是产品经理社区 incentive-icons
人人都是产品经理社区
想要成为大牛先从学做产品开始
64813文章数 311631关注度
往期回顾 全部

科技要闻

鸿蒙7发布,余承东:首个完成AI化改造系统

头条要闻

男子毕业16年后学位证"无法认证" 高校最新通报

头条要闻

男子毕业16年后学位证"无法认证" 高校最新通报

体育要闻

欧洲恐韩?肉德维德?

娱乐要闻

一天4个瓜,肖战热巴最意外

财经要闻

万亿美元顺差背后,透露这些信号

汽车要闻

标配激光雷达/双动力可选 昊铂S600限时售17.99万起

态度原创

亲子
手机
旅游
教育
军事航空

亲子要闻

给孩子报个幼儿园还要工资流水?难道这就是传说中的“因财施教”

手机要闻

狂飙突进!鸿蒙 6 终端设备突破 6600 万,国产系统成第二大手机系统

旅游要闻

明起,恢复运营

教育要闻

冲线·为了在一起 | 积分入学报名的最后一天

军事要闻

伊朗媒体:已故最高领袖葬礼推迟举行

无障碍浏览 进入关怀版