网易首页 > 网易号 > 正文 申请入驻

遍览数年历史视频、挖掘用户兴趣,快手建模方案TWIN入选KDD 2023

0
分享至

机器之心专栏

机器之心编辑部

本期为大家介绍快手 - 社区科学线自研论文:TWIN: TWo-stage Interest Network for Lifelong User Behavior Modeling in CTR Prediction at Kuaishou 本文发表于 2023 年 KDD Applied Data Science Track(录取率 25.4%),旨在解决传统的超长行为建模中长久存在的「两阶段中相似度度量标准不一致」问题,从而提升超长行为建模的精准度。

作者:常健新、张晨斌、傅智毅、臧晓雪、关琳、吕静、惠轶群、冷德维、牛亚男、宋洋

论文地址:
https://arxiv.org/abs/2302.02352

1. 背景与 Motivation

快手,作为中国国民级短视频 APP,一直把痴迷客户作为算法设计的准绳和方向。每天,我们的推荐系统个性化地为每一个用户提供她最喜欢的视频内容,并为每一位创作者找到最知音的受众。为了达成高度个性化推荐这一目标,推荐系统需要充分利用一切宝贵的用户侧特征。

在这一背景下,终身行为建模(也叫做超长行为序列建模,Lifelong user behavior modeling),应运而生。顾名思义,终身行为建模就是从用户数月至数年中积累的几万个历史观看视频中,利用深度学习模块,准确地提取出用户隐藏的兴趣,从而助力推荐系统中的高阶任务,如 CTR 预估等。

1.1 行为序列建模方法

在早期研究中,短期行为建模算法(如 DIN,DIEN 等)往往采用各种 attention 机制,对短期历史行为做加权平均。其中,与 target video 更相似的行为被赋予高权重,而与 target video 不相似的行为则在加权中被压缩。

例如图一中,target video 是双板滑雪教学视频, 与滑雪户外相关的历史行为获得了更高的权重,而音乐唱片等不太相关的历史行为则获得了很低的权重。

图一:传统一阶段 Attention 方法用于短期行为建模

然而,鉴于 Attention 机制中昂贵的计算,这些短期行为建模算法,往往只能处理 100 + 的行为序列。相反地,绝大多数快手的活跃用户,每天就会观看 100 多个视频,几个月下来,就能积累 1 万到 10 万个历史行为。所以,这些有效的短期行为建模算法无法直接被扩展到超长行为序列建模中。近年来,超长行为建模往往采取两阶段建模的方法。我们以这一领域的 SOTA,SIM 算法为例,为大家简要介绍两阶段终身学习算法的共同框架。

1.2 超长行为序列建模的 SOTA

两阶段超长行为建模的范式是:先用一个简单高速的 GSU 模块选择出与 target video 最相关的 top100 个行为,再用复杂精准的 ESU 模块,对这 100 个优胜者,做 target attention(TA),从而提取出超长序列中隐含的用户兴趣表征。如图二所示。

图二:两阶段建模的一般范式,其中 target video 是滑雪教学视频,GSU 粗筛出了滑雪、户外运动相关的视频供 ESU 做 TA

近年来,大量的两阶段建模方法层出不穷,它们的主要区别在于 GSU 依据什么标准来粗筛与 target video 相似的行为。例如,SIM Hard 的 GSU 简单地从历史行为中过滤出与 target video 相同的类别的行为,而 SIM Soft 通过某些预训练任务获得 embedding,计算 target 和历史行为的内积作为相似度量,而后筛选相似度最高的行为。ETA 使用局部敏感哈希 (LSH) 和汉明距离来近似计算相关性分数。SDIM 通过多轮哈希碰撞等方法对与目标行为具有相同哈希签名的行为进行采样。

1.3 两阶段建模方法的缺陷

尽管经过了广泛的研究,现有的两阶段终身行为建模算法仍然存在一个关键的缺陷:GSU 和 ESU 之间,相似度度量标准的不一致。例如:SIM 的 GSU 通过品类过滤或预训练任务中 embedding 的内积距离计算出来的距离度量,和 ESU 中基于 end2end 训练的 target attention,差距较大。如此,GSU 可能会筛选出 ESU 不认可的行为,浪费了 ESU 宝贵的计算能力,却只能在一些与 target 不太相关的行为中权衡注意力的分布。这种不一致性,极大地拉低了超长序列建模模块的表现力,从而伤害了 CTR 预估的精准度。

图三:SIM 中 GSU 和 ESU 的不一致

例如,我们在图三中,用具体的数字直观地说明一下这种不一致的严重程度。在一些小规模数据集上,我们可以不计成本做一个 Oracle,即用 ESU 直接从 1 万个历史行为中,找到 ESU 真正的 top100 作为 ground truth,对比用 SIM-hard 的 GSU 筛选出来的 topK。图中 x 轴代表 GSU 返回 K 个行为,y 轴代表 SIM hard 的 GSU 命中的 ground truth 个数。

我们可以看到,SIM 的 GSU 返回的前 100 个可能只有 40 个是真正的前 100,而 SIM 返回的前 200 也只有 57 个是真正的前 100。图中的灰色区域,就是留给我们解决两阶段不一致问题的提升空间。

所以,如何才能升级 GSU 的计算方法,使它能用与 ESU 一致的距离度量,从而找到在 ESU 中 Attention 权重较高的行为,是弥补现有两阶段算法的缺陷的关键点。

2. TWIN 算法

我们把本文提出的算法命名为 TWIN,即强调我们的 GSU 和 ESU,如同双胞胎一样,应用了同样的目标与行为之间的距离度量。如图四所示。

图四:TWIN,两阶段一致的网络结构

然而这种一致性的达成,是不平凡的。ESU 的距离度量依赖多头目标注意力网络(MHTA),计算极为耗时,所以一般只用在 100 个行为上。换句话说,我们需要解决的是,如何把通常应用于 100 个行为上的 MHTA 提升性能,从而扩展到 GSU 需要处理的 1 万到 10 万个行为上?

图五:特征拆分与线性映射

在实际落地中,我们采用 MHTA 结构,用 4heads 来多角度学习用户的隐藏兴趣。

2.3 系统设计

图六详细地列出了系统设计图,整体分为 3 部分:

图六:系统设计图

3. 实验结果

在于 SOTA 两阶段算法对比中,我们验证了算法的有效性:

图七:与 SOTA 对比

通过分析对 top100 的命中率,我们验证了两阶段的一致性。注意理论上我们的算法 GSU 和 ESU 完全一致,效果应接近 Oracle;然而,由于缓存延迟的 15 分钟,使得实际效果有一定不足(蓝色阴影区域):

图八:两阶段一致性

我们设计丰富的消融实验,证明了不仅两阶段的结构一致很重要,GSU 和 ESU 之间的 embedding 同步也同样对我们的效果提升起到贡献。交叉特征计算的 Bias 项,虽然简单却对效果至关重要。同时,我们的预计算模块,虽然大幅节省了计算时间,对效果的负向影响却很微弱。

我们在三个业务模块中,通过线上 AB 对比实验,验证了算法的有效性。

撰文:吕静,快手模型与应用部

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印度男人的性饥渴:没有生物不能性交!

印度男人的性饥渴:没有生物不能性交!

黯泉
2026-07-02 16:22:23
颐和园、天坛有蛇出没?专家回应“北京公园的蛇好像变多了”

颐和园、天坛有蛇出没?专家回应“北京公园的蛇好像变多了”

极目新闻
2026-07-02 22:36:35
协和林博士一席话点醒无数人:晚年尊严,全靠一身筋骨撑住

协和林博士一席话点醒无数人:晚年尊严,全靠一身筋骨撑住

青苹果sht
2026-06-30 05:50:59
6、5、4!两球之差,第1到第7!六大巨星,史诗级世界杯金靴之争

6、5、4!两球之差,第1到第7!六大巨星,史诗级世界杯金靴之争

慢歌轻步谣
2026-07-02 18:47:28
世界杯淘汰赛解析:哥伦比亚要“杀”疯了!3-0,直接把加纳送回家!

世界杯淘汰赛解析:哥伦比亚要“杀”疯了!3-0,直接把加纳送回家!

天光破云来
2026-07-03 10:46:56
7月5号正式开播,湖南卫视又一部好剧来袭!男女主颜值很高

7月5号正式开播,湖南卫视又一部好剧来袭!男女主颜值很高

小邵说剧
2026-07-03 07:38:21
世界杯场场爆满,数万票价不减热度,美国经济真的不行了吗?

世界杯场场爆满,数万票价不减热度,美国经济真的不行了吗?

青松解局
2026-07-02 15:16:40
大婚风波没过,香港政府“点名”霍启山,原来他跟霍启刚处境一样

大婚风波没过,香港政府“点名”霍启山,原来他跟霍启刚处境一样

归史
2026-07-03 13:21:28
图赫尔未战先怯!英格兰王牌公开认怂!世界杯恐爆大冷

图赫尔未战先怯!英格兰王牌公开认怂!世界杯恐爆大冷

澜归序
2026-07-03 05:04:31
再见了!冯小刚,《抓特务》票房惨败,属于冯小刚的时代结束了

再见了!冯小刚,《抓特务》票房惨败,属于冯小刚的时代结束了

翰飞观事
2026-07-01 14:52:44
81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

揽星河的笔记
2025-11-12 12:36:17
WTT女单爆冷:18岁天才少女剃光头,张本美和挑战世界冠军

WTT女单爆冷:18岁天才少女剃光头,张本美和挑战世界冠军

许钇很机智
2026-07-03 00:11:10
中国人最擅长取外号了,网友:这评论区没半小时出不去

中国人最擅长取外号了,网友:这评论区没半小时出不去

另子维爱读史
2026-05-31 08:10:46
安徽省会合肥,本来有一个非常美的名字,为什么改成了合肥

安徽省会合肥,本来有一个非常美的名字,为什么改成了合肥

今明文史
2026-06-29 09:30:10
今日足球看点:澳大利亚VS埃及,强硬袋鼠军团对决法老技术反击

今日足球看点:澳大利亚VS埃及,强硬袋鼠军团对决法老技术反击

Shoot体育
2026-07-03 07:15:05
65岁老头用零食哄骗小女孩,对其侵害长达两年,12岁女孩怀孕产子

65岁老头用零食哄骗小女孩,对其侵害长达两年,12岁女孩怀孕产子

易玄
2026-06-27 01:06:14
如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

灯锦年
2026-07-01 17:38:16
芬兰曾被沙俄统治108年,为何没成另一个乌克兰?俄化进程太慢了

芬兰曾被沙俄统治108年,为何没成另一个乌克兰?俄化进程太慢了

历史摆渡
2026-07-03 12:55:03
中国58架歼-10B,伊朗要全部打包带走,最快一年即可全部交付?

中国58架歼-10B,伊朗要全部打包带走,最快一年即可全部交付?

锋芒点兵
2026-06-29 17:37:42
2年1230万美金!西蒙斯联手三探花!76人加入老詹争夺战

2年1230万美金!西蒙斯联手三探花!76人加入老詹争夺战

世界体育圈
2026-07-03 12:26:17
2026-07-03 16:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13424文章数 142686关注度
往期回顾 全部

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

头条要闻

办信用卡8年被收8816元年费 女子投诉银行"悄悄扣费"

头条要闻

办信用卡8年被收8816元年费 女子投诉银行"悄悄扣费"

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

AI“鬼故事”不断,市场开始重估?

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

亲子
艺术
健康
教育
公开课

亲子要闻

因为你的到来,让我们更幸福

艺术要闻

当代画家 张奇人物油画作品选

这4类消化病患者 吃粘食管住嘴

教育要闻

7月5日—7日,这些批次进行志愿填报!注意事项来了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版