当50万人的医疗数据出现在中国电商平台的货架上,英国生物银行(UK Biobank)的负责人却用了"几个害群之马"来解释整件事。这种归因方式,是真相还是推卸?
事件回溯:数据怎么流出去的
![]()
上周,英国政府确认,英国生物银行的数据集出现在阿里巴巴平台上待售。这些数据包含50万名参与者的去标识化医疗信息,原本只向三家学术机构的研究人员开放。
英国生物银行是一个运行超过20年的大型健康数据库。2006年至2010年间,40至69岁的志愿者贡献了包括全身扫描、DNA序列和完整病历在内的私密健康数据。这个数据库已助力痴呆症、部分癌症和帕金森病的检测与治疗研究。
其在线研究平台向全球获批学术机构的科学家开放,供他们获取去标识化的参与者数据集用于科研。平台的设计初衷是平衡数据开放与隐私保护——但现在,这个平衡被打破了。
科技大臣伊恩·穆雷(Ian Murray)向下议院说明,涉事数据不含姓名、地址、联系方式或电话号码,但可能包括性别、年龄、出生年月、社会经济地位、生活习惯以及生物样本检测指标。
英国生物银行已自我报告至英国数据监管机构信息专员办公室(ICO)。
正方:机构方的危机应对与归因
英国生物银行负责人罗里·柯林斯爵士(Professor Sir Rory Collins)以双重身份回应此事——既是机构负责人,也是数据库参与者之一。他告诉BBC,自己对此感到"愤怒"和" upset"。
「几个害群之马把这些数据从平台上下载,然后挂出去售卖,」柯林斯在BBC广播四台《今日》节目中说,「通过与英国政府和中国政府迅速合作——我们非常感谢他们的帮助——我们能够在任何数据被售出之前下架那些 listings。」
机构采取的措施包括:永久封禁涉事的三家学术机构,暂停所有在线研究平台访问权限,增设额外管控机制。柯林斯称这是"实质上暂停科学进展",以换取系统安全性的重建。
他的核心论点很明确:这是个别研究人员的违规行为,而非系统性漏洞;机构发现及时、处置果断;跨境协作有效阻止了实际损害发生。
反方:去标识化承诺的裂缝
但柯林斯在同一档节目中承认了一个关键事实:当被问及参与者是否可能通过数据集与其他信息结合被识别时,他说"不可能"完全排除这种可能性。
这句话的分量需要拆解。英国生物银行向志愿者承诺的是"去标识化"保护——即移除直接身份信息后的数据可以安全共享。但柯林斯的表态意味着,这种保护存在理论上的失效场景。
性别、年龄、出生年月、社会经济地位、生活习惯的组合,在特定情境下足以缩小到可识别的个体范围。这不是假设——2019年《自然》子刊已有研究表明,美国人口中87%的人可通过邮编、性别、出生日期三重组合被唯一识别。
英国生物银行的数据颗粒度远高于此。它包含生物样本指标、全身扫描、DNA序列。柯林斯说"没有证据表明已发生识别",但这与"不可能发生"是两种完全不同的承诺等级。
更深层的问题在于数据流转机制本身。平台向全球学术机构开放访问,数据下载权限的边界在哪里?三家机构的研究人员能够批量导出足够用于商业售卖的数据集,说明技术管控存在盲区。"害群之马"论回避了一个问题:如果几个人就能完成数据提取和跨境转移,这个"篮子"本身的编织密度是否足够?
我的判断:信任重建比追责更紧迫
这件事的真正产品启示在于:开放科学基础设施的信任模型正在经历压力测试。
英国生物银行的设计代表了健康数据共享的一种理想形态——大规模、 longitudinal(纵向追踪)、多维度、向科研开放。它的价值已被验证:20年间产出的研究成果惠及多种重大疾病领域。但这种模式依赖于一个脆弱的前提:参与者相信"去标识化"等于"不可识别"。
柯林斯的"不可能完全排除"是一种诚实的专业表述,但在公共传播中,它与机构此前向志愿者传递的安全感之间存在张力。这种张力不会因为下架 listings 和封禁机构而自动消除。
从产品设计视角看,英国生物银行正在做的——暂停平台、增设管控——是必要但不充分的。充分的做法需要回答:数据访问的颗粒度能否进一步细化(例如从数据集下载变为云端分析环境)?行为审计的实时性能否提升(而非依赖事后发现)?跨境数据流动的技术追踪是否可行?
这些问题的答案将决定类似基础设施的可持续性。健康数据的科研价值与隐私风险之间的张力不会消失,但处理这种张力的方式可以进化。
对于科技从业者而言,这个案例提供了一个具体的观察窗口:当数据规模达到50万人、时间跨度超过20年、维度覆盖从基因到生活方式时,"信任"本身需要被重新设计为可验证、可审计、可撤销的技术机制,而非依赖机构声誉和善意承诺。
柯林斯说"几个害群之马"时,或许是在保护一个更宏大的科学项目的公众形象。但参与者需要的不是形象保护,而是可验证的安全边界。英国生物银行的下一步动作——ICO调查结论、技术管控升级细节、对受影响志愿者的具体沟通策略——将比当下的危机回应更能说明问题。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.