以用户为中心的社交网络已成为当今世界最为流行的信息分享平台。社交网络推荐以推送的方式给用户提供最佳的建议,是解决网络中信息爆炸式增长带来的信息过载问题的有效途径。但目前网络中的数据呈爆炸式增长,引起了信息过载和隐私泄露等问题。
随着社交网络的飞速发展,社交网络的应用范围逐步扩展,用户规模不断扩大,信息更新速度不断加快,社交网络已成为互联网的一大发展趋势,不仅满足人们网上交流的需求,更成为人们分享、获取和传播信息的重要渠道。用户规模呈爆炸式增长,用户身边充斥着大量信息,为了对其提供精准化的服务,推荐系统得到了广泛应用。
基于社交网络的个性化推荐示意图
传统的推荐系统需要服务器集中用户原始数据产生推荐结果,在这一过程中用户的隐私易受到威胁。 2016 年,欧盟发布了《通用数据保护条例》,禁止商业公司在未经相应用户许可的情况下收集、处理或交换用户数据。紧接着美国和中国也分别相继出台了类似的法律规定(《美国数据隐私和保护法》和《中华人民共和国个人信息保护法》)。推荐系统的研究对国家安全也具有重大意义,如社交网络中的个性化信息排序和推荐对社会舆情和热点事件监测起到积极的引导作用,以及通过对社交网络中的社交关系的预测和推荐可以提升反恐、网络诈骗的检测效率和准确率。随着推荐系统在社交网络中应用范围的拓展和用户参与度的不断增加,隐私保护成为一个日益敏感的问题。
《面向隐私保护的社交网络推荐》由安徽师范大学郑孝遥教授、罗永龙教授撰写,从社交网络推荐面临的问题出发,阐述了社交网络推荐的内涵、隐私保护的常用方法及缓解数据稀疏的跨域推荐,从三个维度系统地介绍了社交网络推荐的原理与方法。
☟上下滑动查看更多
Slide for more photos
面向隐私保护的社交网络推荐
郑孝遥 , 罗永龙著
北京 : 科学出版社 , 2024 . 1 2
ISBN 978 - 7 - 03 - 080341 - 2
本书对社交网络推荐算法及其隐私保护方法展开介绍,主要包括矩阵分解推荐算法、差分隐私保护推荐方法、联邦推荐隐私保护方法及跨域推荐方法四个方面,具体研究成果及主要结论如下:
▋1. 目前社交网络推荐注重模型和算法的研究,并没有有效地剖析社交网络结构。另外,矩阵因子分解法可解释性较差。针对上述问题,在第2 章中提出了以超图拓扑结构来分析和描述推荐系统中的社交网络内在联系,然后在矩阵因子分解法的基础上,加入了上下文情境、用户和项目特征描述、用户评价等社交因素,构建混合推荐模型。针对矩阵分解等潜在因子推荐方法的可解释性差的问题,在第3 章提出了一种基于核化网络的社交网络推荐模型,将显式的用户-项目评分矩阵以用户或项目(即行或列)为基准分解成向量,同时该模型通过关联规则算法挖掘用户社交网络的隐式信息,再进行核化处理,将自动编码层的编码映射到更高维的空间,提高用户和项目特征表达的准确性。将核化表征后的向量再经过多层感知器,将矩阵因子分解的线性模型转换成非线性模型,提高整个模型的可塑性和健壮性。大量实验验证了该模型可以有效提高社交网络推荐的准确性和可解释性 。
▋2. 针对社交网络中用户评分、评论及位置等信息造成用户隐私泄露问题,在第4~9 章分别提出基于奇异值分解的隐私保护推荐、基于多级随机扰动的隐私保护推荐、基于差分隐私的兴趣点推荐、基于分布式差分隐私的推荐、基于差分隐私的并行离线推荐和基于差分隐私的并行在线推荐。兴趣点推荐模型分别从用户标签中提取用户兴趣点和时序因素下的用户评分,计算用户兴趣偏移度,并以正则项的形式融入矩阵分解模型中,以提高推荐准确性,同时设计指数机制的隐私邻居选择方法,防范
k近邻(
k-nearest neighbor,KNN)攻击,同时采用拉普拉斯(Laplace)机制在模型的梯度下降过程中加上随机噪声,提升推荐模型的安全性。多样性隐私保护推荐算法将稀疏的用户项目评分填充后,随机加入服从高斯分布的噪声,防止攻击者识破特定分布,从而反解矩阵、恢复隐私信息。分布式用户隐私保护推荐框架利用差分隐私保护技术实现对用户偏好的保护,同时利用保序加密函数实现对用户位置的保护。另外,针对传统矩阵分解推荐算法在处理大规模数据集时会遇到模型训练速度慢、预测时间较长等问题,第8 章和第9 章在Spark 平台上设计了一种基于差分隐私的并行离线推荐和并行在线推荐算法,在提高算法运行效率的同时,确保用户隐私的安全性。
在线推荐模型图
▋3. 针对集中推荐面临数据孤岛问题,在第10~12 章分别提出基于本地差分隐私的联邦推荐、基于秘密共享的联邦推荐和基于迁移学习的跨组织联邦矩阵分解推荐。基于本地差分隐私的联邦推荐用全局均分、项目均分、用户均分与矩阵分解线性加权的结果来预测用户评分,同时对所有的评级归一化设置并添加Laplace 噪声后发送给数据聚合器,以降低全局敏感度,保护用户敏感信息的同时提升推荐准确性。基于秘密共享的联邦推荐首先在用户端对本地模型的梯度进行分解,使用秘密共享协议在用户间传输中间结果,然后引入了用户项目交互值,把分解后的值与虚假梯度一起共享给随机选择的用户,服务器收到用户发来的虚假信息聚合后得到真实的更新值,未降低推荐精度,并保护了用户值隐私、过程隐私、存在隐私。基于迁移学习的跨组织联邦矩阵分解推荐算法使用第11 章算法预训练组织内用户潜在因子矩阵和项目潜在因子矩阵,将训练后的项目梯度加密发送至目标方,目标方将项目梯度的加密值进行解密操作,更新本地的项目矩阵,保证了组织间信息传输的安全性,并提高了全局推荐模型的准确度。
▋4. 迁移学习可以向数据稀疏的评分领域迁移已有的数据信息,缓解数据稀疏问题。本书在第13 章和第14 章使用迁移学习研究社交网络推荐数据稀疏的问题。在第13 章提出单稀疏辅助域的跨域推荐算法,以矩阵分解和聚类为核心步骤,先将辅助域矩阵分解成用户潜在因子矩阵和项目潜在因子矩阵,然后通过聚类算法将这两个矩阵聚集成类簇级评级模式,并取二者的点积,得到辅助域类簇级评级模式。而后,通过将类簇级评级模式扩展到目标域,弥补目标域缺失数据。在第14 章提出多稀疏辅助域的自适应跨域推荐算法。通过单稀疏辅助域的跨域推荐算法获取每个单稀疏辅助域推荐后的结果。然后通过抽取部分测试集测试目标域推荐的均方根误差,判断该辅助域和目标域之间的相关程度,并在权重与迁移约束条件下更新迭代直至收敛,即完成辅助域的自适应迁移。最后在多个公开数据集上的实验结果表明,跨域推荐可以有效缓解数据稀疏问题,提高推荐的性能。
本书可作为计算机相关专业高年级本科生、研究生以及推荐系统开发人员的参考书,也可作为数据安全领域广大科技工作者的参考书。
本文摘编自《 面向隐私保护的社交网络推荐 》( 郑孝遥 , 罗永龙著 . 北京 : 科学出版社 , 2024 . 1 2 )一书“序言”,有删减修改,标题为编者所加。
ISBN 978 - 7 - 03 - 080341 - 2
责任编辑: 蒋 芳 李佳琴 赵晶雪 曾佳 佳
(本文编辑:刘四旦)
一起阅读科学!
科学出版社│微信ID:sciencepress-cspm
专业品质 学术价值
原创好读 科学品位
科学出版社视频号
硬核有料 视听科学
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.