在将数据分组时,避免形成不必要的相似元素聚集对医学数据分析至关重要。来自杜塞尔多夫海因里希·海涅大学(HHU)的心理学家和计算机科学家于2020年开发了一种新方法来解决这一“反聚类”问题。现在,他们与加利福尼亚大学旧金山分校(UCSF)的研究人员合作开发了一种扩展,这对高通量测序数据及其他相关数据的分析非常重要。研究人员在期刊Cell Reports Methods中介绍了他们的新工具在慢性疾病子宫内膜异位症中的应用。
子宫内膜异位症是一种复杂且常常伴有疼痛的疾病,影响着全球数百万女性。类似于子宫内膜的组织会在子宫外生长,比如在卵巢或甚至肠道上。这些组织在月经周期中可能会有所变化。
为了研究子宫内膜异位症的发展和严重性中起作用的细胞和分子因素,来自加州大学旧金山分校和斯坦福大学的多学科专家正在对数百名女性的数据进行分析,这项研究是ENACT中心的一部分,由加州大学旧金山分校的Linda C. Giudice博士和Marina Sirota博士,以及斯坦福大学的Brice Gaudilliere博士和David K. Stevenson博士共同领导。由加州大学旧金山分校的副教授Tomiko T. Oskotsky博士领导的团队,正在努力确保涉及高通量技术(如单核RNA测序)的研究实验设计稳健。
由于技术原因,样本需要分批处理。如果这些批次没有经过仔细平衡,比如考虑到疾病阶段或患者的年龄,所谓的批次效应可能会扭曲结果,最终会使我们判断观察到的差异是否具有生物学原因,还是仅仅是技术过程中的伪影变得困难。
这就是反聚类方法的出现,来自亥姆霍兹大学的马丁·帕彭贝格博士和算法生物信息学教授古纳尔·克劳博士在2020年于期刊心理学方法中提出的。研究人员已将“anticlust”模块免费提供给大家。
帕彭贝格博士解释说:“为了满足ENACT团队的技术需求,除了之前的反聚类方法,还需要将相关样本,比如来自同一患者的多个组织样本,分在同一批次中,以便能够对个别患者进行有意义的比较。”他通过开发一种叫做“必须链接方法”的新方法,成功解决了这个新挑战。
克劳教授说:“我们成功地扩展了我们的方法,使得需要保持在一起的样本能够被分拣到一个批次,同时在不同批次之间保持良好的样本平衡。这防止了方法偏差,医学同事可以从数据中得出结论,这些结论具体与基因对子宫内膜异位症的影响相关。”
奥斯科茨基教授解释道:“通过更好的实验设计,使用抗聚类方法来最小化批次效应,我们相信我们分子数据中的发现真正反映了基础生物学。这种方法有助于获得关于子宫内膜异位症的新见解,并展示了经过深思熟虑的计算方法的应用如何显著改善生物医学研究。”
更多信息: 马丁·帕彭贝格等,反聚类用于样本分配来最小化批次效应,细胞报告方法(2025)。 DOI: 10.1016/j.crmeth.2025.101137 www.cell.com/cell-reports-meth … 2667-2375(25)00173-0。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.