网易首页 > 网易号 > 正文 申请入驻

大语言模型能大规模识别匿名用户身份,准确度令人震惊

0
分享至


研究人员表示,社交媒体上的匿名账户越来越容易被人工智能分析识别出其背后的真实用户,这一发现对互联网隐私具有深远影响。

这一发现来自最近发表的一篇研究论文,基于将特定个人与多个社交媒体平台上的账户或帖子进行关联的实验结果。成功率远超现有的传统去匿名化工作,后者依赖人类组装结构化数据集进行算法匹配或熟练调查员的手工工作。召回率(即成功去匿名化的用户数量)高达68%,精确度(即正确识别用户的猜测率)可达90%。

我知道你去年发布了什么

这些发现有可能颠覆假名制,这是许多人用来发布查询和参与有时敏感的公共讨论的一种不完美但通常足够的隐私保护措施,同时让其他人难以准确识别发言者。廉价快速识别这些隐藏账户背后真实用户的能力,使他们面临人肉搜索、跟踪以及详细营销档案汇编的风险,这些档案可追踪发言者的居住地、职业和其他个人信息。这种假名制保护措施不再有效。

"我们的发现对在线隐私具有重要影响,"研究人员写道。"普通网络用户长期以来一直在一种隐含的威胁模型下运作,他们假设假名制提供了足够的保护,因为有针对性的去匿名化需要大量努力。大语言模型使这一假设失效。"

研究人员从公共社交媒体网站收集了几个数据集来测试这些技术,同时保护发言者的隐私。其中一个数据集收集了Hacker News和LinkedIn个人资料的帖子,然后通过用户个人资料中出现的跨平台引用将它们链接起来。然后他们去除了帖子中所有识别性引用,并在其上运行大语言模型。第二个数据集来自Netflix发布的微身份数据,如个人偏好、推荐和交易记录。2008年的一篇研究论文显示,该列表可以识别用户并确定他们的政治倾向和其他个人信息。最后一种技术分割了单个用户的Reddit历史记录。

"我们发现这些AI智能体可以做一些以前非常困难的事情:从自由文本(如匿名采访记录)开始,它们可以追溯到一个人的完整身份,"论文共同作者Simon Lermen告诉Ars。"这是一个相当新的能力,以前的重新识别方法通常需要结构化数据,以及两个具有类似模式且可以链接在一起的数据集。"

Lermen说,与那些较老的假名剥离方法不同,AI智能体可以浏览网络并以与人类相同的许多方式与之交互。它们可以使用推理来匹配潜在个体。在一个实验中,研究人员查看了Anthropic关于各种人如何在日常生活中使用AI的问卷回答。使用从答案中获取的信息,研究人员能够准确识别125名参与者中的7%。

虽然7%的召回率相对较低,但它展示了AI基于人们提供的非常一般信息识别个人的日益增长的能力。"AI能够做到这一点这一事实本身就是一个值得注意的结果,"Lermen说。"随着AI系统变得更好,它们可能会越来越擅长找到更多身份。"

在第二个实验中,研究人员收集了2024年来自r/movies子版块以及至少五个较小社区之一的评论:r/horror、r/MovieSuggestions、r/Letterboxd、r/TrueFilm和r/MovieDetails。结果显示,候选人讨论的电影越多,识别他们就越容易。分享一部电影的用户平均有3.1%可以以90%的精确度识别,1.2%可以以99%的精确度识别。对于分享五到九部电影的用户,90%和99%精确度分别上升到8.4%和2.5%。超过10部共享电影将百分比提升到48.1%和17%。

在第三个实验中,研究人员从Netflix数据集中取出5000个用户,并添加了另外5000个不在结果中的"干扰"身份。然后他们在10000个候选档案列表中添加了5000个查询干扰项,包括只出现在查询集中、在候选池中没有真正匹配的用户。

与模仿Netflix Prize攻击的经典基准相比,大语言模型去匿名化远超前者。

研究人员写道:

(a) 经典攻击的精确度下降很快,这解释了其低召回率。相比之下,基于大语言模型的攻击的精确度随着攻击者做出更多猜测而更优雅地衰减。(b) 经典攻击在适度低精确度下几乎完全失效。相比之下,即使是最简单的大语言模型攻击(搜索)也能在低精确度下实现不可忽视的召回率,通过推理和校准步骤扩展它可以使99%精确度下的召回率翻倍。

结果表明,大语言模型虽然仍然容易出现假阳性和其他弱点,但正在迅速超越更传统的、资源密集型的在线用户识别方法。

研究人员继续提出缓解措施,包括平台对用户数据API访问实施速率限制,检测自动抓取,以及限制批量数据导出。大语言模型提供商也可以监控其模型在去匿名化攻击中的滥用,并建立防护措施使模型拒绝去匿名化请求。

当然,另一个选择是人们大幅减少社交媒体使用,或者至少定期在设定时间阈值后删除帖子。

研究人员警告,如果大语言模型在去匿名化方面的成功继续提高,政府可能会使用这些技术揭露在线批评者,企业可以组装客户档案进行"超精准广告投放",攻击者可以大规模构建目标档案以发起高度个性化的社会工程诈骗。

"大语言模型能力的最新进展清楚地表明,迫切需要重新思考计算机安全的各个方面,以应对大语言模型驱动的攻击性网络能力,"研究人员警告道。"我们的工作表明,隐私方面也可能如此。"

Q&A

Q1:大语言模型如何识别匿名用户身份?

A:大语言模型通过分析用户在不同社交媒体平台的帖子内容,使用推理能力匹配潜在个体身份。它们可以从自由文本(如匿名采访记录)开始,提取结构化身份信号,自主搜索网络识别候选个体,并验证候选人是否匹配所有提取的声明。

Q2:这种去匿名化技术的准确率有多高?

A:根据实验结果,召回率(成功去匿名化的用户数量)可达68%,精确度(正确识别用户的猜测率)可达90%。在Netflix数据集实验中,用户讨论的电影越多,识别准确率越高,超过10部共享电影的用户识别率可达48.1%。

Q3:如何防护这种大语言模型去匿名化攻击?

A:研究人员建议的防护措施包括:平台对用户数据API访问实施速率限制、检测自动抓取、限制批量数据导出;大语言模型提供商监控模型滥用并建立防护措施;个人用户可以大幅减少社交媒体使用或定期删除历史帖子。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美以开打一周欲拖盟友“下水” 伊朗再袭美“林肯”号航母

美以开打一周欲拖盟友“下水” 伊朗再袭美“林肯”号航母

大象新闻
2026-03-06 07:27:19
9岁女孩泰国游泳三天晒成酱油色,回国时在海关被质疑国籍,“你有中国护照吗?”

9岁女孩泰国游泳三天晒成酱油色,回国时在海关被质疑国籍,“你有中国护照吗?”

观威海
2026-03-05 22:23:02
广东一女子收到男友送的生日礼物刮刮乐花束,刮出一等奖80万元,最新回应:奖金将孝敬父母、旅游、存银行

广东一女子收到男友送的生日礼物刮刮乐花束,刮出一等奖80万元,最新回应:奖金将孝敬父母、旅游、存银行

大象新闻
2026-03-06 02:03:20
以色列:去年11月已决定刺杀哈梅内伊,当时内塔尼亚胡与特朗普已开始沟通此事

以色列:去年11月已决定刺杀哈梅内伊,当时内塔尼亚胡与特朗普已开始沟通此事

极目新闻
2026-03-06 13:46:51
连亏八年,股价却从24涨到255,不声不响地涨了10倍!

连亏八年,股价却从24涨到255,不声不响地涨了10倍!

财经智多星
2026-03-06 10:57:50
伊朗封锁霍尔木兹海峡,五星红旗成为了“通行证”,美西方国家急了

伊朗封锁霍尔木兹海峡,五星红旗成为了“通行证”,美西方国家急了

麓谷隐士
2026-03-06 11:13:24
关键时刻,中国给伊朗开放北斗服务。

关键时刻,中国给伊朗开放北斗服务。

荆楚寰宇文枢
2026-03-05 23:16:13
非洲19岁女孩远嫁河南48岁农民,生俩混血儿,称:我每天都在享福

非洲19岁女孩远嫁河南48岁农民,生俩混血儿,称:我每天都在享福

谈史论天地
2026-03-06 09:52:47
没想到,46岁霍启刚因两会上的这一提议,让香港四大家族刮目相看

没想到,46岁霍启刚因两会上的这一提议,让香港四大家族刮目相看

寻墨阁
2026-03-06 03:58:19
政府报告三提“休假”背后:一年117天假 为什么中国人还休不够

政府报告三提“休假”背后:一年117天假 为什么中国人还休不够

冷观互联网
2026-03-06 11:48:12
“德纳”舰返航途中遭美军鱼雷击沉:300公斤弹头爆炸,船体断成两半!伊外长:它是印度海军的客人;印度回应

“德纳”舰返航途中遭美军鱼雷击沉:300公斤弹头爆炸,船体断成两半!伊外长:它是印度海军的客人;印度回应

每日经济新闻
2026-03-05 22:08:43
纯电续航950km“全球第一”,比亚迪王朝首款D级旗舰SUV大唐发布

纯电续航950km“全球第一”,比亚迪王朝首款D级旗舰SUV大唐发布

IT之家
2026-03-05 21:41:52
魏建军代言魏牌V9X:一场关于信任的“极限测试”

魏建军代言魏牌V9X:一场关于信任的“极限测试”

汽车通讯社
2026-03-05 21:49:10
美军据报或对袭击伊朗学校负责

美军据报或对袭击伊朗学校负责

界面新闻
2026-03-06 10:43:25
63岁大爷植入阴茎假体成功,60岁老伴开心不已

63岁大爷植入阴茎假体成功,60岁老伴开心不已

映射生活的身影
2026-03-05 11:59:48
全国人大代表、广西壮族自治区党委书记陈刚:今天就“亮亮家丑”

全国人大代表、广西壮族自治区党委书记陈刚:今天就“亮亮家丑”

极目新闻
2026-03-06 14:14:14
他成为韩国大学教授了?

他成为韩国大学教授了?

奋斗在韩国
2026-03-06 13:26:13
耿爽履新中国人民外交学会副会长

耿爽履新中国人民外交学会副会长

澎湃新闻
2026-03-06 14:54:26
为什么全世界都容不下犹太人?黑格尔坦言:犹太信仰与世界对立

为什么全世界都容不下犹太人?黑格尔坦言:犹太信仰与世界对立

月下守候
2026-03-05 22:18:43
真只死了6个?曝美军承包商紧急招聘数名临时工,专门处理阵亡士兵物品

真只死了6个?曝美军承包商紧急招聘数名临时工,专门处理阵亡士兵物品

不掉线电波
2026-03-06 10:00:34
2026-03-06 15:24:49
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
2085文章数 163关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

伊军指挥官:这几天只是清库存 会亮从未公开的大杀器

头条要闻

伊军指挥官:这几天只是清库存 会亮从未公开的大杀器

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

黄金,牛市没了?!

汽车要闻

710km长续航+闪充 宋Ultra EV预售15.5万起

态度原创

健康
数码
手机
家居
公开课

转头就晕的耳石症,能开车上班吗?

数码要闻

MacBook Neo基准测试成绩接近iPhone 16 Pro 与M1表现相当

手机要闻

一加15T爆料汇总!小直屏大容量电池超吸睛

家居要闻

暖棕撞色 轻法奶油风

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版