网易首页 > 网易号 > 正文 申请入驻

终于!大模型与推荐系统结合了,代码实战与案例分析

0
分享至

文/刘强

ChatGPT与大模型技术的影响已经渗透到各行各业,无论是谁,都无法忽视其带来的革命性变化。

自2023年初以来,我一直密切关注大模型的进展,特别是在推荐系统中的应用。

在这个每天都有新突破的时代,保持技术的领先至关重要。为此,我花费了近一年的时间,撰写了《大模型推荐系统:算法原理、代码实战与案例分析》一书。

这是国内首本系统介绍大模型在推荐系统中应用的书籍,我希望这本书能够为国内的技术普及和推广贡献一份力量,引发更多关于大模型技术在推荐系统领域的探索和应用。

大模型通过海量的互联网文本信息,通过在底层构建Transformer架构,预测下一个token(token可能是一个单词也可能是一个单词的一部分)出现的概率来训练模型(BERT等模型是基于左右两边的token预测中间的token,这属于模型架构上的不同)。

由于有海量互联网文本数据,模型的训练过程不需要人工标注(但需要对数据进行预处理),一旦模型完成预训练就可以用于解决语言理解和语言生成任务。

简单来说,大模型基于海量文本中token序列中下一个token出现的概率进行统计建模,来学习在给定语言片段后出现下一个token的概率来解决下游任务(比如文本摘要、翻译、生成文本等)。

对于推荐系统,用户过往的操作行为其实就是一个有序的序列,每个用户的操作序列类似于一篇文本,所有用户的操作行为序列类似于大模型的训练语料库。预测用户下一个操作行为就类似于预测词序列的下一个token(这里推荐系统的物品类似语言模型中的一个token)。

通过这个简单的类比,我们就知道推荐系统可以被嵌入到大模型的理论框架中。因此,直观地看,大模型一定可以用于解决推荐系统问题。

上面的思路比较简单,只用到了用户与物品的交互信息。实际上,推荐系统的数据来源更复杂,除了有用户交互序列,还有用户画像信息、物品画像信息等。部分用户画像、物品画像信息(比如用户的年龄、性别、偏好等,物品的标题、标签、描述文本等)可以利用自然语言来呈现,行为交互序列、用户画像、物品画像等信息都可以输入大模型中,给大模型提供更多的背景知识,最终的推荐会更加精准。

推荐系统涉及很多的多模态数据(比如物品有描述文本、有图片、甚至有视频介绍等),这类异构的信息对于推荐系统的效果相当重要。多模态信息可以通过转化为文本信息供大模型使用,目前的多模块大模型可以直接处理多模态数据,这类多模态大模型也可以直接用于推荐系统。

即使不使用图片、视频等多模态数据,目前只利用好文本数据,就能使大模型的能力十分强大了。大模型的强大之处是具备ICL(zero-shot、few-shot)的能力,只需要在使用大模型过程中设计一些prompt(提示词)和模板(template)来激活大模型的推荐能力。

大模型有上百亿、上千亿、甚至上万亿参数,是一个非常庞大的神经网络。当用一些prompt告诉大模型作为一个推荐系统角色进行推荐时,就激活了深度神经网络中的某些连接,这些连接是神经网络的某个子网络,而这个子网络具备进行个性化推荐的能力,这个过程非常类似人类大脑神经元的工作机制,比如你看到美食时,就会激活大脑中负责进食的区域——这个区域是大脑整个复杂神经元网络的子网络,导致看到美食可能流口水、吞咽等行为,这里看到美食就类似大模型的prompt。

另外,我们在进行头脑风暴时,突然被别人启发想到某个绝妙的创意也是一种激活过程。对于few-shot更复杂一些,需要在prompt中告诉大模型一些怎么进行推荐的案例(比如用户看了A、B、C三个视频后,会看另外一个视频D),让它临时学习怎么做推荐。

除了直接利用大模型的ICL、CoT能力进行推荐,我们可以将推荐系统相关的数据按照大模型的输入、输出范式进行准备,然后通过监督学习微调大模型,这样可以让大模型更好地适配具体的推荐场景,这也是大模型应用于推荐系统的一个非常有价值的方向。

另外,大模型强大的生成能力可以生成任何形式的符号序列,借助外界的工具(比如机械臂),大模型还能制造“新产品”,这一能力同样可以用到推荐系统中:在新闻推荐中,大模型可以将海量发生的事件进行原子化、然后进行重组,以你感兴趣的叙述方式展现给你,为你“创造”新的信息;大模型还可以基于用户的偏好,为用户设计喜欢的“服装”,进而通过3D打印自动生产个性化的产品。

通过前面的介绍,相信你能够大致知道为什么大模型可以应用于推荐系统,以及将大模型应用于推荐系统的独特优势,怎样将大模型应用于推荐系统呢?这就是本书的核心主题——将大模型应用于推荐系统的4大范式:生成范式、预训练范式、微调范式、ICL推荐范式。书中为每个范式都提供了具体的原理讲解、案例分析和算法实现,帮助你掌握每个范式的核心思想。

推荐系统作为过去10年互联网科技中最重要的技术手段,是互联网公司最核心的商业化工具,创造了抖音、TikTok等以推荐系统为核心引擎的、具备极大变现效率的产品。一般来说,越是具备商业价值的场景,人类越会利用新技术去变革它。推荐系统的商业价值巨大,因此也是以大模型为驱动引擎的新技术革新的方向之一!

借助当前的(多模态)大模型,企业级推荐系统可以获得更强、更新技术的赋能,从数据生成、特征构建、召回、排序、内容生产、流程控制、推荐解释、冷启动等多个维度获得能力的增强。

在上面的企业级推荐系统架构图中,数字标注的部分是可以利用大模型进行优化、增强、甚至是取代的,具体体现在9类场景中:

(1) 大模型生成行为数据

(2) 大模型生成兴趣画像

(3) 大模型生成个性商品描述

(4) 大模型进行召回(语义召回)

(5) 大模型排序(ICL)

(6) 大模型进行推荐解释

(7) 大模型解决冷启动

(8) 大模型控制业务流程

(9) 大模型进行产品设计&生产

这些应用场景是当前推荐系统新的机会。

以推荐系统最有业务价值的电商场景来说,大模型在上述场景中都能用得上。下面用一个脑图来总结大模型在电商场景上的应用。

这部分对应本书中案例部分的重点内容——大模型在电商场景中的7种应用:

有了大模型加持的推荐系统就像人有了大脑一样,可以将传统的推荐技术等融合到一个统一的对话式框架下,让大模型利用已有的工具(传统的召回算法、搜索、比价等)提供更加个性化、更好交互友好的推荐。

将大模型比作人类的大脑,大模型对推荐系统的最大影响莫过于革新了整个推荐交互流程。基于大模型的对话能力,我们可以采用类似ChatGPT的互动式对话方式为用户进行推荐,这时推荐系统就升级成了一个服务于每个用户的、个性化的专业顾问。

比如,阿里巴巴在2023年上半年在淘宝上开启了淘宝问问(一个对话式推荐产品)的内测。

除此之外,支付宝也发布了基于对话式交互的“支小宝”新产品,百度也将大模型应用到了最核心的广告营销场景,Meta已经在尝试利用大模型技术进行万亿级参数的新一代推荐系统的尝试……可见,互联网大厂已经走在了前面,尝试将大模型应用到推荐系统中。

掌握大模型在推荐系统中的方法,才能更好地应对AI变革大势。

希望你可以从本书中获得启发和帮助,尽早入门和实践大模型推荐系统!

↑双十一优惠中↑

双十一优惠中,快快抢购吧!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国钢琴圣手,被人把痰盂扣头上,30岁与母亲弟弟吸煤气而亡

中国钢琴圣手,被人把痰盂扣头上,30岁与母亲弟弟吸煤气而亡

卷史
2026-02-28 05:06:44
以色列总理发表全国声明

以色列总理发表全国声明

界面新闻
2026-02-28 16:21:58
宇树科技王兴兴首次公开披露工厂落地进展,2025年人形机器人出货量超5500台

宇树科技王兴兴首次公开披露工厂落地进展,2025年人形机器人出货量超5500台

金融界
2026-02-28 17:50:31
新加坡大满贯赛:大爆冷!头号种子2:3被淘汰,世界第2无缘八强

新加坡大满贯赛:大爆冷!头号种子2:3被淘汰,世界第2无缘八强

国乒二三事
2026-02-24 13:15:11
账号被封禁,所有作品已清空!

账号被封禁,所有作品已清空!

艳姐的搞笑视频
2026-01-16 10:10:11
美以突袭伊朗,一场特朗普的个人战争

美以突袭伊朗,一场特朗普的个人战争

晓看说
2026-03-01 00:38:37
真相大白!林诗栋输给勒布伦原因曝光,王皓场边无奈摇头晃脑

真相大白!林诗栋输给勒布伦原因曝光,王皓场边无奈摇头晃脑

曹说体育
2026-02-28 18:56:46
国际刑事法院检察官:杜特尔特是菲律宾禁毒战“最应负责的人”

国际刑事法院检察官:杜特尔特是菲律宾禁毒战“最应负责的人”

仙气美少女
2026-02-28 18:54:56
中国游客不去日本消费,中国经济反而比日本亏?这笔账给你掰到底

中国游客不去日本消费,中国经济反而比日本亏?这笔账给你掰到底

何氽简史
2026-02-27 19:20:59
18岁亚马尔首个帽子戏法,巴萨反超皇马4分,2亿欧先生再创新纪录

18岁亚马尔首个帽子戏法,巴萨反超皇马4分,2亿欧先生再创新纪录

夏侯看英超
2026-03-01 01:58:13
刚复出即开演唱会,票价高达1280,自信何来?

刚复出即开演唱会,票价高达1280,自信何来?

秋枫凋零
2026-02-28 00:41:14
丈夫影院暴打男小三,妻子带娃出轨视频曝光,真容被扒后续更炸裂

丈夫影院暴打男小三,妻子带娃出轨视频曝光,真容被扒后续更炸裂

壹月情感
2026-02-28 14:02:30
春搭:一种向光展开的身体宣言

春搭:一种向光展开的身体宣言

疾跑的小蜗牛
2026-02-28 21:59:56
伊朗伊斯兰革命卫队发布4号公告:位于科威特的大量美军人员伤亡

伊朗伊斯兰革命卫队发布4号公告:位于科威特的大量美军人员伤亡

财联社
2026-03-01 05:54:16
央视直播!对阵中国台北,郭士强大胆变阵,首发5人曝光,2人落选

央视直播!对阵中国台北,郭士强大胆变阵,首发5人曝光,2人落选

萌兰聊个球
2026-02-28 10:50:02
炸了!山东 6 条高铁同时在建,全国第一,这下真要起飞了!

炸了!山东 6 条高铁同时在建,全国第一,这下真要起飞了!

王二哥老搞笑
2026-02-28 11:36:19
中朝边境鸭绿江口现状:朝鲜领土正在不断增加,中方却在逐渐减少

中朝边境鸭绿江口现状:朝鲜领土正在不断增加,中方却在逐渐减少

普览
2026-02-26 21:29:19
特朗普大失所望,伊朗将投入“神秘”武器!中方表态,多国选边站

特朗普大失所望,伊朗将投入“神秘”武器!中方表态,多国选边站

起喜电影
2026-03-01 00:17:31
拉夫罗夫:莫斯科将把所有历史上的俄罗斯土地归还其合法家园

拉夫罗夫:莫斯科将把所有历史上的俄罗斯土地归还其合法家园

番茄说史聊
2026-02-22 14:07:52
退休金一旦超过这2个数,就属于“人上人”,晚年无忧

退休金一旦超过这2个数,就属于“人上人”,晚年无忧

有故事的人
2025-11-17 06:29:06
2026-03-01 06:56:49
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3248文章数 11088关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

以官员称哈梅内伊身亡 遗体在其官邸废墟中被找到

头条要闻

以官员称哈梅内伊身亡 遗体在其官邸废墟中被找到

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

时尚
教育
房产
本地
军事航空

这6款发色居然这么火?50张图可以直接给tony

教育要闻

又看了一遍…觉得这册子真的太牛了…

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

本地新闻

津南好·四时总相宜

军事要闻

美国以色列联合袭击伊朗 实时战况

无障碍浏览 进入关怀版