网易首页 > 网易号 > 正文 申请入驻

推荐系统真正「懂你」:快手团队在NeurIPS 2025提出新成果TagCF

0
分享至



每天,推荐系统都在捕捉我们的兴趣与偏好。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的理解上,推断用户喜欢哪类视频、哪种话题,擅长在「内容层」识别用户喜欢什么,却很少真正理解「你是谁」。

快手消费策略算法团队注意到了这一问题,他们想让推荐系统不止「会猜」,而是「懂你」。为弥补这一缺失的建模角度,快手消费策略算法团队联合快手基础大模型与应用部及武汉大学,提出了 TagCF 框架,让推荐系统从「知其然」迈向「知其所以然」。

该研究成果已被 NeurIPS 2025 接收,相关代码与实验框架已全面开源,旨在为学术界与工业界提供一套以「理解驱动」为核心的推荐系统方法论。



  • 论文标题:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation
  • 论文: http://arxiv.org/abs/2505.10940
  • 代码: https://github.com/Code2Q/TagCF

背景和动机

用户理解:A Missing Formulation



图 2

当推荐系统通过统计模型学出两个内容之间的关联并据此进行推荐时,这种关联背后往往隐藏着用户角色这一「混杂因素」。如图2 所示,headset-symphonist-violin 的关联关系,实则来源于「交响乐手」这一用户角色;在电商场景中,「啤酒-新晋奶爸-尿布」的经典案例同样印证了这一点。相比基于 ID 的传统隐式建模,引入user role视角让推荐系统得以更清晰地理解用户,从而迈向显式的可解释推荐演进。

另一方面,当需要建模 topic-topic 关联时,本身可以将其当作 topic-role-topic 关联的结果图。这意味着引入 user role 的建模方式在逻辑上更具通用性与表达能力。这种通用的协同行为建模,不仅能捕捉那些统计方法难以识别的弱交互,还能精准建模并有逻辑地突破用户的信息茧房(后文有验证)。

并且,团队还通过实验发现,基于 user role 的建模在统计意义上优于传统的 topic 建模,不仅具备更稳定的空间,也能带来更显著的推荐效果提升。

综上所述,一个更有效的推荐系统需要有能力通过用户与物料之间的交互数据,学习到用户是一个什么样的人,并找到涉及用户角色的通用的原则性的客观逻辑规律。

注:文章后续描述中 user tag = user role = 用户特性,item tag = item topic = 兴趣点。

两个新任务

除了传统的推荐任务外,本研究借鉴 topic modeling 的思路,为推荐系统拓展出两个新任务:

用户角色识别(User Role Identification):建模一个用户的特征、个性、社会角色、需求;其中特征包含但不限于用户直接提供的特征值(如性别和年龄)。

用户行为逻辑建模(Behavioral Logic Modeling):建模 user role 和 item topic 之间的逻辑关联图(如图3),可细分为 I2U 和 U2I 两个子任务:

  • I2U:具有某一特性(topic)的物料适合分发给什么特性(role)的用户。
  • U2I:具有某种特性(role)的用户会希望看到什么特性(topic)的物料。



图3

解决方案

模块设计



图4 - TagCF 主要功能模块

TagCF 主要包含如下三个模块:

  • 基于 MLLM 的视频内容理解中台:系统遍历每天新增的视频(达到一定曝光数量后),利用 MLLM 模型(M3[1])对每个视频i提取多模态内容和视频 embedding,然后通过人工设计的 prompt(图5)引导 MLLM 模型理解视频语义,从而自动生成相应的 item tag 与 user tag,并实时更新标签库。



图5

  • 基于 LLM 的行为逻辑图探索中台:在得到两种 tag 集合后,第二步就是构建 tag2tag 逻辑图,即 U2I 和 I2U 逻辑图。具体的,根据给定的起始 tag,我们构建对应的逻辑推理 prompt(图6),并通过一个 LLM(QWen2.5-7B[2])来生成对侧的目标 tag。



图6

  • 赋能下游推荐系统:在获得内容理解的 tag 信息和 tag2tag 逻辑图后,下游推荐系统可以使用这些中台信息对推荐模型进行对应的增强(属 LLM-for-rec 范式,有别于 LLM-as-rec 范式)。为了保证建模空间的一致性,团队提出可以单独针对 itemtag 空间或 usertag 空间进行模型增强,对应的方案为TagCF-it和TagCF-ut。实验验证了三个可行的推荐系统增强方案:基于 tag 的 encoder 模型增强、基于 tag-logic 对齐的训练增强和基于 tag-logic 的预估分数增强。

注:文章认为内容理解中台产出的 tag-logic 体系虽然来自于推荐系统且验证于推荐系统,但其具有一定通用性,尤其行为逻辑图也被验证有一定迁移能力,未来可以为其他相关业务(如电商和搜索)赋能。

挑战和工程方案

实现过程中也存在如下挑战:无限制生成导致的 tag 集合无序扩张、视频覆盖率长尾分布、无序生成和精细打分需求的矛盾、大模型生成结果缺乏评测手段等。

为了解决上述问题,文章提出了几个有效的解决方案并在线上落地:

  • 构建弱重叠高频 tag 子集,即 cover set:该方法旨在自动化地提取使用效率高的 tag 子集,在后验观测上发现高频 tag 经验上比长尾 tag 具有更好的通用性。cover set 的构建也分为 usertag 和 itemtag 两个对称的部分,其过程相近,具体流程如下:



经验上,cover sets 在量级上为 7k-20k 不等,相比开放语义空间中的全集,cover sets 能够在 30 天内收敛,在工业场景下具有足够的稳定性和通用性,有利于各种下游链路的研发。

  • 对内容理解结果进行模型蒸馏:主要目的是根据 MLLM 和 LLM 产出的 item2tag 数据和 tag2tag 数据训练对应的蒸馏小模型,以便对 tag 进行精细排序,对应的蒸馏模型后续在推荐过程中也会被重复利用。

  • 人工大模型对比验证:采用经典的 Good-Same-Bad 策略,从准确率、完整度、合理性和可读性等多个维度进行了人工评测。结果显示,该方法在效果上已能满足工业级应用需求,整体表现与GPT-4o接近。





显式茧房建模和突破

基于上述三个模块,TagCF-it 模型延续兴趣点建模思路,而 TagCF-ut 模型则拓展至用户角色识别与行为逻辑挖掘。至此,推荐系统已有能力显式地建模用户茧房并通过统计模型进行对齐。

具体的,团队通过学习得到的模型预估出对应的茧房内(top-20)tag 集合,记为 T(0),然后通过 U2I 和 I2U 逻辑图以一定 branch factor 进行发散,得到茧房外的 tag 集合,记为 T(1)。下图为示例:



可以显式控制的两种预估策略:

  • TagCF-util:仅使用T(0),维持茧房内特性,注重提升准确度。
  • TagCF-expl:使用T(0)和T(1)的并集,突破茧房并进行相关新特性探索,注重提升多样性。

实验

离线实验

主实验在快手的 industrial 离线数据集上首先得到验证。

  • NDCG 和 MRR 是推荐准确率指标,Cover 和 Gini 是多样性指标。



实验结论:

  • TagCF 能有效增强 backbone 模型推荐效果。

  • 提取的逻辑图中台可以 transfer 到其他数据集上(仅 transfer 逻辑图,item2tag 信息仍然需要额外的大模型推理生成和蒸馏模型对齐),且仍然能够提升对应 backbone 的效果。

  • 两种 TagCF 变体呈现出不同的行为特性,TagCF-ut 整体准确率更好,TagCF-it 则更容易提升多样性。

三个增强模块的 Ablation 验证了对应模块设计的有效性。



线上实验

在研究中,团队进行了线上重排阶段的模型增强实验,其具体的 workflow 如下图:



  • 团队进行了模型增强、训练增强和预估打分增强,且在打分增强阶段分别实验了 TagCF-util 和 TagCF-expl。



  • 在实验中,团队发现 TagCF-expl 能够有效提升用户长期留存指标 LT+0.037%。

此外,团队还观测到,usertag 集合比 itemtag 集合具有更强的稳定性和表达能力,体现在其更小的集合大小、更快的收敛速度(如下表所示)以及 3.1 节所示更强的模型增强效果。这些优势意味着,相比兴趣点,用户角色是更加稳定的特征,更加适于推荐系统中的建模和分析。



总结和思考

快手团队从推荐系统的「双端视角」出发,首次提出「视频理解与用户理解并重」的理念,并证明了以用户理解为核心的推荐系统在当前范式下的独特优势。推荐系统的目标从来不只是「推荐内容」,它更关乎理解人(微观)与社会(宏观)的科学。

基于这一理念,团队构建了 TagCF ——包含 tag-logic 内容理解中台和推荐系统增强两个组成部分。tag-logic 内容理解中台具备强大的可迁移能力,其通用框架也可以在召回等其他链路阶段使用,未来可扩展至召回、电商、搜索等多业务场景;另一方面,推荐系统增强模块将有能力直观建模用户茧房并进行突破和探索。

推荐系统与大模型的结合,正在让内容分发进入一个全新的阶段。

它能更聪明地理解用户、更精准地匹配内容,也带来了关于隐私、安全与公平的新思考。未来,团队将继续完善 tag-logic 中台体系,探索更高效的推理与资源利用方式。

长期以来,行业主要深耕于统计模型建模路径,快手也相继推出了 OneRec[3] 与 GoalRank[4] 等代表性前沿技术成果。而本文提出的显式用户理解与 tag-logic 建模方法,则在符号与统计两种范式之间搭起了桥梁,为行业带来了全新的想象空间。

更重要的是,tag-logic 逻辑图让系统有能力从用户的信息茧房出发,展开有逻辑的语义探索——既保持精准,又敢于突破。如何在「准确」与「多样」之间找到平衡,正是推荐系统进化的关键命题。从「懂内容」到「懂人」,TagCF 的探索不仅是技术的一次跃迁,更是技术贴近真实的人与社会的具象体现。

参考文献:

[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.

[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024

[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).

[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
斯诺克最新战报!希金斯打五杆50+,8-8战平肖恩·墨菲,吴宜泽有望扩大领先优势

斯诺克最新战报!希金斯打五杆50+,8-8战平肖恩·墨菲,吴宜泽有望扩大领先优势

体坛最前线66
2026-05-01 20:32:37
为何我国会放弃遍地翡翠,富产金丝楠木,价值抵百个香港的江心坡

为何我国会放弃遍地翡翠,富产金丝楠木,价值抵百个香港的江心坡

抽象派大师
2026-04-30 00:17:23
33岁郭晓婷近况曝光!与王天辰因戏生情,如今婚姻生活很幸福

33岁郭晓婷近况曝光!与王天辰因戏生情,如今婚姻生活很幸福

代军哥哥谈娱乐
2026-05-01 12:26:49
刚刚确认,今晚抵达湖北!请提前准备

刚刚确认,今晚抵达湖北!请提前准备

极目新闻
2026-05-01 14:26:37
神舟二十三号备战发射,2名国外航天员穿上中国宇航服:照片来了

神舟二十三号备战发射,2名国外航天员穿上中国宇航服:照片来了

环球科学猫
2026-04-30 11:03:50
金价,大跌!黄金失去避险能力?世界黄金协会回应

金价,大跌!黄金失去避险能力?世界黄金协会回应

新浪财经
2026-04-30 20:53:57
从0-4到6-0逆转世界第一:22岁兰州选手距世锦赛决赛仅一步之遥

从0-4到6-0逆转世界第一:22岁兰州选手距世锦赛决赛仅一步之遥

竞技风云录
2026-04-30 19:23:07
去城里的姑父家拜年,姑姑让我滚,后来她从新闻上看到我任命县长

去城里的姑父家拜年,姑姑让我滚,后来她从新闻上看到我任命县长

千秋文化
2026-04-30 18:46:59
信仰崩塌,五粮液疯狂改业绩,上百亿利润凭空消失!股民:无良液

信仰崩塌,五粮液疯狂改业绩,上百亿利润凭空消失!股民:无良液

金石随笔
2026-05-01 09:41:31
展现性感身材,劳塔罗妻子晒比基尼照

展现性感身材,劳塔罗妻子晒比基尼照

懂球帝
2026-04-30 14:45:11
观察:上海最大的“八万人”体育场,今冲击上海文体上座率“三大纪录”!

观察:上海最大的“八万人”体育场,今冲击上海文体上座率“三大纪录”!

上观新闻
2026-05-01 04:31:07
第一个面临消失的职业,不是幼师,不是快递员,而是这三种工作?

第一个面临消失的职业,不是幼师,不是快递员,而是这三种工作?

一网打尽全球焦点
2026-05-01 19:04:21
792万新生儿创下新低,未来20年无数家庭可能撑不过下一代!

792万新生儿创下新低,未来20年无数家庭可能撑不过下一代!

青眼财经
2026-05-01 16:53:58
围棋天才常昊:不顾恩师反对,娶大8岁二婚师姑,现今怎么样了?

围棋天才常昊:不顾恩师反对,娶大8岁二婚师姑,现今怎么样了?

拳击时空
2026-05-01 06:32:29
霍尔木兹海峡,大消息!特朗普,新动作!油价跳水,黄金、白银,突变!

霍尔木兹海峡,大消息!特朗普,新动作!油价跳水,黄金、白银,突变!

证券时报e公司
2026-04-30 22:44:03
扒光网红白冰真实收入:4000万粉丝到底多赚钱?日入数字超乎想象

扒光网红白冰真实收入:4000万粉丝到底多赚钱?日入数字超乎想象

贱议你读史
2026-05-01 20:15:03
南方暴雨大暴雨又将上线,2日最强!行程最好避开强降水时段

南方暴雨大暴雨又将上线,2日最强!行程最好避开强降水时段

澎湃新闻
2026-05-01 19:32:04
赛程密集?瓜帅:必须适应,若你不喜欢就去法国、葡萄牙执教

赛程密集?瓜帅:必须适应,若你不喜欢就去法国、葡萄牙执教

懂球帝
2026-05-01 20:05:08
起风了!季麟连获一边倒力挺,郑丽文发出通告,赵少康无地自容!

起风了!季麟连获一边倒力挺,郑丽文发出通告,赵少康无地自容!

李博世财经
2026-05-01 16:56:59
“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

妍妍教育日记
2026-04-15 09:30:09
2026-05-01 21:12:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12902文章数 142639关注度
往期回顾 全部

科技要闻

苹果上季在华收入继续大增 iPhone收入新高

头条要闻

70岁法国老人骑浙江品牌摩托车 穿越多国抵达杭州

头条要闻

70岁法国老人骑浙江品牌摩托车 穿越多国抵达杭州

体育要闻

无奈!约基奇:这要在塞尔维亚 全队早被炒了

娱乐要闻

马筱梅产后身材恢复超好 现身户外直播

财经要闻

GPU神话松动,AI真正的战场变了

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

亲子
本地
旅游
公开课
军事航空

亲子要闻

宝蓝和爸爸比赛吹气球,吹成各种各样的形状,快来看看谁赢了~

本地新闻

用青花瓷的方式,打开西溪湿地

旅游要闻

五一“微度假”受热捧|惠民县田园景区日迎万人 无动力设施成亲子游新宠

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:持续推进海上封锁的行为不可容忍

无障碍浏览 进入关怀版