网易首页 > 网易号 > 正文 申请入驻

IJCAI 2020 | 推荐中的深度反馈网络

0
分享至

  本文介绍的是IJCAI-2020论文《Deep Feedback Network for Recommendation》,作者论文作者是来自腾讯微信的谢若冰、凌程、王亚龙、王瑞、夏锋和林乐宇研究员。

   者 | 谢若冰

  编辑 | 丛 末

  1

  导语

  在推荐系统中,用户的显式反馈、隐式反馈、正反馈和负反馈都能够反映用户对于被推荐物品的偏好。这些反馈信息在推荐系统中十分有用。然而,现在的大规模深度推荐模型往往以点击为目标,只看重以用户点击行为为代表的隐式正反馈,而忽略了其它有效的用户反馈信息。

  作者在本文中关注用户多种显式/隐式和正/负反馈信息,学习用户的无偏兴趣偏好。具体地,作者提出了一个Deep Feedback Network (DFN)模型,综合使用了用户的隐式正反馈(点击行为)、隐式负反馈(曝光但未点击的行为)以及显式负反馈(点击不感兴趣按钮行为)等信息。DFN模型使用了internal feedback interaction component抓住用户行为序列中的细粒度的行为级别的交互,然后通过external feedback interaction component,使用精确但稀少的隐式正反馈和显式负反馈作为监督,从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。

  在实验中,作者基于微信看一看的数据,进行了丰富的离线和在线实验,模型与baseline相比均取得显著提升。

  2

  模型背景与简介

  推荐系统在日常生活中被广泛使用,为用户获取信息与娱乐提供便利。推荐系统算法往往基于用户与系统的交互,这些交互行为可以大致分为以下两类:显式反馈与隐式反馈。

  显式反馈从用户对于物品的直接态度中获取,例如评论中的一星到五星,或者微信看一看系统中的“不感兴趣”按钮。这类反馈能够直接表达用户的正向以及负向偏好,但是这类反馈的数量往往不多。

  隐式反馈从用户的行为中间接获得,例如用户的点击/不点击行为。这些信息在推荐系统中往往是海量的,但是这些信息有着较多噪声(用户点击的并不一定是他真正喜欢的)。另外,隐式反馈通常是以正反馈的形式出现,推荐中的隐式负反馈存在巨大噪声(未展现信息或者未点击信息并不一定意味着用户不喜欢这些内容)。

  在近期的深度推荐系统中,CTR导向的目标受到极大关注。因此,模型不可避免地只关注和目标紧密相关的用户点击行为,忽略了其它用户行为中蕴含的丰富信息。仅考虑CTR导向目标的推荐模型往往会遇到以下两个问题:

  (1)CTR导向目标只关注用户喜欢什么,没有关注用户不喜欢什么。这样,模型的推荐结果容易同质化和趋热化,损害用户体验。因此,负反馈信息是必要的。

  (2)用户除了被动地接受系统推荐的物品,有时也需要能够主动和即时的反馈机制。用户希望能够高效和准确地告知系统自己喜欢或者不喜欢什么。

  另外,用户的显式和隐式反馈之间也会存在割裂(用户点击的并不一定是他真正喜欢的)。因此,显式反馈也是必要的。显式信息和隐式信息能够作为彼此的补充,相辅相成。已有工作通过使用用户的未点击/未曝光行为作为用户的隐式负反馈,这样会引入极大的噪声。另外一些工作尝试使用用户的显式负反馈信息。这些信息固然精确,但是也往往比较稀疏。

  图1:微信看一看系统中的三种反馈,从左到右分别为隐式正反馈(点击行为)、隐式负反馈(曝光但未点击的行为)以及显式负反馈(点击不感兴趣按钮行为)

  为了解决这些问题,综合使用用户多种显式/隐式和正/负反馈信息学习更好的无偏用户表示,作者提出了一个Deep Feedback Network (DFN)模型。图1中给出了在微信看一看场景中的三种用户反馈。

  DFN通过internal feedback interaction component抓住用户行为序列中的细粒度行为级别的交互,然后通过external feedback interaction component,使用精确但稀少的隐式正反馈和显式负反馈作为监督,从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。这些反馈特征会和其他用户/物品特征混合,并行使用FM、Deep和Wide层进行特征交互,最后进行CTR预估。作者基于微信看一看推荐系统,设计了离线和线上实验,在多个指标上具有显著提升。这篇工作的主要贡献如下:

  1、作者第一次融合隐式正反馈(点击行为)、隐式负反馈(曝光但未点击的行为)、显式负反馈(点击不感兴趣按钮行为)和它们之间的交互信息进行用户行为建模;

  2、作者提出了一个全新的Deep Feedback Network (DFN)模型,能够学习到用户无偏的兴趣偏好;

  3、模型在离线和在线任务上都得到了显著提升,具有工业级实用价值。论文中也提出了一个feed流中的显式负反馈预测任务。

  3

  模型结构

  DFN模型主要分为三个阶段:首先,deep feedback interaction module以用户的多种反馈行为作为输入,输出用户的反馈特征。然后,Feature Interaction Module进一步考虑用户的其它特征和物品特征,使用FM、Deep和Wide层进行特征交互。最后,输出层使用CTR作为训练目标。图2给出了DFN的整体结构。

  图2:DFN的整体结构

  deep feedback interaction module是模型的主要创新点。它包括了两个组成部分:Internal Feedback Interaction Component和ExternalFeedback Interaction Component。图3给出了deep feedback interaction module的结构。

  图3:deep feedback interaction module

  首先,在Internal Feedback Interaction Component中,用户的隐式正反馈、隐式负反馈和显式负反馈序列和target item一起,通过一个transformer层,得到了在各个序列内部细粒度的item-level的交互信息,然后经过average层得到三种反馈的特征表示,其中隐式正反馈特征中蕴含高质量的用户正向偏好,显式负反馈特征中蕴含高质量的用户负向偏好。

  第二步,在External Feedback Interaction Component中,隐式负反馈序列往往是三种行为中最多的行为,但也是噪声最大的行为。作者把高质量的和target item交互后的隐式正反馈特征和显式负反馈特征看作一种高质量指导,从用户未点击序列中挖掘用户或许喜欢/不喜欢的物品,补充用户的正向负向偏好。作者使用了一个attention层得到了两种用户弱正向/负向反馈特征。这两种弱反馈特征和第一步的三种反馈特征拼接后成为最终的用户反馈特征。

  第三步,在Feature Interaction Module中,作者使用了FM、Wide和Deep层,对用户其它特征、物品特征和用户反馈特征等进行低阶/高阶特征交互。这一个模块是为了充分利用各种特征辅助推荐,使得模型在真实工业级任务上达到最好的效果。使用Wide层主要是为了给潜在的特征工程留下接口。

  最后,作者基于CTR loss进行训练。除去传统的正例和未点击负例,作者还增加了一项预测用户负反馈点击的loss。由于在实际推荐系统中,用户给出主动显式负反馈的次数极少,显式负反馈中的负向信息也极其强烈,所以作者单独在loss中强调了这一项,并且给予了较大的训练权值。

  4

  实验结果

  离线和线上实验均在微信看一看上进行,离线数据集包含千万级用户在百万级物品上的亿级行为。模型离线CTR预估结果如图4:

  图4:CTR预估结果

  DFN模型取得了SOTA结果。作者还在图5给出一个新的不感兴趣预估实验。由于用户点击不感兴趣按钮说明了用户对于推荐结果很失望,这类推荐结果会极大损害用户体验,模型应该能够对这类反馈及时捕捉并且响应,理想状态下应该通过用户实时行为避免用户产生显式负反馈的结果。

  图5:dislike预估结果

  作者还进行了消融实验证明了反馈模块的每一个组成部分都是有效的。

  图6:消融实验结果

  最后,作者还给出了参数实验,探索不感兴趣的loss的权重影响。

  图7:参数实验结果

  5

  总结

  在本文中,作者初步研究了推荐系统中的多种显式/隐式和正/负反馈之间的协同合作机制。 DFN模 型能够基于多种反馈信息即时学习到用户的无偏的正负向兴趣,在点击预估和不感兴趣预估等多个任务上均有提升效果。 直观而有效的模型也使得DFN能成功在工业级推荐系统中得到部署和验证。

  我们预测用户的显式反馈,特别是显式负反馈的信息将会未来推荐系统中起到更加重要的作用,在发掘推荐系统可解释性同时提升用户体验。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上限乔丹下限科比!榜眼彼得森炸裂首秀,28分征服夏季联赛!

上限乔丹下限科比!榜眼彼得森炸裂首秀,28分征服夏季联赛!

田先生篮球
2026-07-05 07:58:06
三连胜全是假象!死里逃生的这一刻,阿根廷的世界杯才算真正开始

三连胜全是假象!死里逃生的这一刻,阿根廷的世界杯才算真正开始

桑启红原
2026-07-05 07:26:02
我在养老院住了7年,想劝所有打算来的老人:做不到这5点千万别来

我在养老院住了7年,想劝所有打算来的老人:做不到这5点千万别来

蝉吟槐蕊
2026-07-04 08:01:13
7月1日大陆刚换了个字,国民党就慌了。

7月1日大陆刚换了个字,国民党就慌了。

叶葉夜
2026-07-03 07:37:04
“监狱海王”邹显卫:监狱私建独门小院,女狱警心甘情愿当情人

“监狱海王”邹显卫:监狱私建独门小院,女狱警心甘情愿当情人

寄予的清风
2026-07-03 21:29:28
绿军为什么用29岁布朗换伤痕乔治?图什么?凯尔特人疯了吗

绿军为什么用29岁布朗换伤痕乔治?图什么?凯尔特人疯了吗

林子说事
2026-07-05 15:29:48
去省厅报到遇前妻,她羞辱我不懂规矩,我坐上厅长位:你再说一遍

去省厅报到遇前妻,她羞辱我不懂规矩,我坐上厅长位:你再说一遍

千秋文化
2026-07-02 19:53:21
争议!巴拉圭门将出局后用球怒砸姆巴佩:他无视我的祝贺,没风度

争议!巴拉圭门将出局后用球怒砸姆巴佩:他无视我的祝贺,没风度

我爱英超
2026-07-05 08:39:40
内贾德一封百字唁电就在点穆杰塔巴:人没到,信到了,背后全是局

内贾德一封百字唁电就在点穆杰塔巴:人没到,信到了,背后全是局

爱下厨的阿酾
2026-07-04 16:18:16
火热的夏日:那不是煎熬,是生命被调到了最亮的档位

火热的夏日:那不是煎熬,是生命被调到了最亮的档位

疾跑的小蜗牛
2026-07-05 19:52:54
摩洛哥才是2026年美加墨世界杯最可怕的球队,没有之一

摩洛哥才是2026年美加墨世界杯最可怕的球队,没有之一

民间胡扯老哥
2026-07-05 10:29:38
局势太明显!国乒昔日四大顶尖主力,如今只剩莎莎一人硬扛女单

局势太明显!国乒昔日四大顶尖主力,如今只剩莎莎一人硬扛女单

隐于山海
2026-07-05 20:07:30
医院里震碎三观的八卦有哪些?网友:第一个好恶心,至少影响胃口

医院里震碎三观的八卦有哪些?网友:第一个好恶心,至少影响胃口

解读热点事件
2026-07-04 00:05:21
如果毛岸英没有牺牲,会担任什么职务?

如果毛岸英没有牺牲,会担任什么职务?

始于初见见
2026-07-03 23:05:09
车圈恒大该现身了,海外销量真假即将揭晓,数字游戏难长久

车圈恒大该现身了,海外销量真假即将揭晓,数字游戏难长久

柏铭锐谈
2026-07-05 18:44:42
75岁宝岛首富又迎第三春,老三舞厅出身嗲功了得,正宫装聋作哑!

75岁宝岛首富又迎第三春,老三舞厅出身嗲功了得,正宫装聋作哑!

小陆搞笑日常
2026-07-04 00:43:36
外网热议主裁判坦塔舍夫:最糟糕的裁判,当WWE裁判会更在行

外网热议主裁判坦塔舍夫:最糟糕的裁判,当WWE裁判会更在行

懂球帝
2026-07-05 08:14:18
上海交大解剖241名乳腺癌死者,发现患乳腺癌的人,有这些特点

上海交大解剖241名乳腺癌死者,发现患乳腺癌的人,有这些特点

垚垚分享健康
2026-07-04 21:30:05
外媒中国KJ-500已经超过50架!数量比全球总和还多

外媒中国KJ-500已经超过50架!数量比全球总和还多

瞩望云霄
2026-07-02 18:19:06
于帕梅卡诺:奥利塞不会加盟皇马,他会留在拜仁

于帕梅卡诺:奥利塞不会加盟皇马,他会留在拜仁

懂球帝
2026-07-05 12:31:15
2026-07-05 20:36:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7428文章数 20761关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

世界杯带火岛国佛得角 当地中国人:最近国人多了起来

头条要闻

世界杯带火岛国佛得角 当地中国人:最近国人多了起来

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

本地
手机
旅游
公开课
军事航空

本地新闻

国内足球之旅?这座小城给你高分答案

手机要闻

全网吵翻!到底是谁带头取消了有线耳机?网友:错怪苹果了

旅游要闻

不必远赴江南,滇中这片湖泊自带星河意境,看完人人都想去打卡!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京与特朗普通话85分钟 细节公布

无障碍浏览 进入关怀版