网易首页 > 网易号 > 正文 申请入驻

细胞迎来AlphaFold时刻!史上最强开源模型震撼登场,木头姐强推的下一个风口,生物学奇点将至!

0
分享至

数字化生命的愿景,正在一步步变成现实。

就在今天,Arc Institute发布了其第一代虚拟细胞模型STATE,该模型旨在预测各种干细胞、癌细胞和免疫细胞对药物、细胞因子或基因扰动的反应

据悉,STATE基于1.7亿个细胞的观测数据以及超过1亿个细胞的单细胞扰动数据进行训练。发言人表示,这是迄今为止任何其他模型都未曾达到的数据量,在预测新细胞背景下扰动后转录组的变化方面,它显著优于现有的最先进计算方法。

目前该模型已开源,可用于非商业用途,代码和模型参数已上传至GitHub及Huggingface。

成立于2021年的Arc Institute是一家位于美国加州的顶级生物医学研究机构,其为科学家提供长期、无附带条件的资助,从而可以更自由地追求好奇心驱动的科学项目。今年2月,Arc Institute就曾联合推出当时最大的开源生物学模型Evo 2,参数高达400亿。

继以Alphafold为代表的模型革命性地推进了人类对蛋白质的认知后,越来越多的科学家正将研究重心转向更复杂的细胞层面,利用AI模拟细胞生命活动,探索背后的分子机制与调控规律。

前不久,木头姐管理的ARK Invest发布的Big Ideas 2025报告认为,单细胞组学与AI的结合将推动虚拟细胞的发展,重塑药物发现的方式

峰瑞资本指出,虚拟细胞正站在一个崭新的发展节点上,凭借政策支持、科研突破、产业投入以及AI技术进步,这一领域有望迎来发展机遇,并对生物医药产生深远的影响。

数据算法双突破,性能全方面提升

当我们想要知道某款药物将对细胞带来什么影响时,传统方法需要做大量耗时且昂贵的实验,而虚拟细胞模型的出现,提供了一个全新的解决方案。

通过精确预测细胞对各种扰动(例如药物、基因或环境)的反应,STATE为揭示生命规律、理解疾病机制以及开发创新疗法铺平了道路。

这一重磅突破的实现,得益于研究团队在数据训练与算法架构方面做出的努力。

首先在数据方面,STATE基于近1.7亿个细胞的观测数据以及超过1亿个细胞的单细胞扰动数据进行训练,这是迄今为止任何其他模型都未曾达到的水平。

Arc Institute表示,STATE最初专注于单细胞RNA测序数据,然而测序数据通常纯粹是观测性的,不足以推断细胞生物学中的因果关系。

为了开发出一个真正扎根于生物学机制的虚拟细胞模型,团队收集了大规模的扰动数据:即通过实验(例如CRISPR工具)故意改变特定基因以观察其对细胞影响的数据,并通过AI工具加速了数据收集过程。

长期以来,单细胞研究领域面临着一个关键挑战:大多数数据来源于分散的小型研究,由于实验技术和样本来源的差异,导致不同项目间的数据难以实现无缝整合。

为应对这一挑战,Arc Institute创新性地开发了scBaseCount——该领域首个基于智能体AI技术的单细胞数据分析平台,这一突破性工具通过标准化数据收集和分析流程,显著降低了批次效应带来的偏差。目前,scBaseCount已成为全球规模最大的开源单细胞数据库。

数据之外,STATE在算法上的创新同样令人印象深刻,研究人员开发了一个多尺度机器学习架构,由两个相互关联的模块组成:STATE Embedding modelSESTATE Transition modelST

图:STATE

其中,SE将转录组数据转换为计算机更容易理解的平滑多维向量空间,同类型的细胞会在这个向量空间中会聚集在一起,使得模型能够更好地理解细胞之间的相似性、差异性以及它们如何响应扰动。

ST负责学习和理解细胞如何从一个初始生物学状态转换到另一个响应状态(如受到特定药物扰动后的新状态),采用双向Transformer架构,使模型能够灵活地捕获生物学和技术异质性(例如细胞周期状态或RNA-seq数据中的偏差),而无需依赖明确的分布假设。

在跨数据集的系统评估中,该模型在药物扰动(Tahoe-100M)、细胞因子扰动(Parse-PBMC)和遗传扰动(Replogle-Nadig)三类数据集上均取得突破性表现。

在Tahoe-100M上的基准测试中,STATE在区分扰动效应方面表现出50%的改进,并且在识别真实差异表达基因方面的准确性是现有模型的两倍在所有度量指标和数据尺度上。STATE实现了对线性基准模型的全面超越,这在业内尚属首次。

令人印象深刻的是,在严格的零样本测试环境下(训练集完全不含目标细胞类型),模型对五种全新细胞系的效应量预测相关性显著提高,展现出强大的泛化能力

研究人员表示,在预测新细胞背景下扰动后转录组的变化方面,STATE明显优于现有的最先进计算方法。

接棒AI蛋白质,虚拟细胞时代开启

Arc Institute表示,STATE仅仅是其一系列模型中的第一个版本,随着虚拟细胞训练数据的增长,其预测准确性将会随之提高。

在团队看来,AlphaFold之所以有用,很大程度上因为研究人员找到了将其蛋白质预测结果整合到工作流程中的方法,而STATE也将遵循这一模式,尽快使得这一成果真正运用到药物研发之中。

Arc Institute的目标是最终使未来版本的虚拟细胞模型的准确性与实验精度相当,这将使科学家能够运行数百万次计算机模拟扰动,从而缩小假设范围。

近来,关于虚拟细胞的成果层出不穷,国内外重大虚拟细胞项目纷纷启动。

近日,华盛顿大学蛋白质设计研究所所长David Baker联合创立的Xaira Therapeutics宣布,发表名为X-Atlas/Orion的全球最大规模单细胞扰动测序数据集。

6月初,美国艾伦研究所宣布启动「细胞景观」(CellScapes项目,旨在结合尖端成像技术与AI模型来揭示细胞原理,构造细胞动态图景,为科学家预测乃至设计细胞提供强大工具。

今年3月,“十四五”重大科技基础设施——人类细胞谱系大科学研究设施正式启动建设,由中国科学院广州生物医药与健康研究院牵头,将绘制人体中全生命周期的细胞时空演化图谱,打造数字细胞AI大模型。

不久之前,DeepMind首席执行官Demis Hassabis也公开表达了对虚拟细胞的强烈兴趣,认为这可能会彻底改变生物学研究。

图:2024诺贝尔化学奖得主David Baker、Demis Hassabis和John M Jumper(从左至右)

其中,David BakerDemis Hassabis因其在AI蛋白质领域的突出贡献获得2024年诺贝尔化学奖,两位领军人物的新动作预示着继AI改变蛋白质研究后,虚拟细胞将接棒成为下一个焦点。

虚拟细胞在药物研发、精准诊断和个性化医疗等领域展现出强大的应用潜力,顶尖投资机构对此展现出浓厚兴趣。

木头姐创立的ARK Invest在《Big Ideas 2025》中强调,单细胞组学与AI的结合将推动虚拟细胞的发展,变革药物发现方式。

报告认为,虚拟细胞模拟细胞功能并预测在不同生物状态下对扰动的反应,标志着药物发现领域的一次重大突破。ARK Invest预计,虚拟细胞在预测分子结构方面将实现与AlphaFold相同的效率提升。

峰瑞资本指出,虚拟细胞这一前沿交叉领域吸引了越来越多的企业,尤其是在欧美地区,创业公司表现尤为活跃。这些公司可以大致分为两类:

第一类企业专注于构建虚拟细胞的基础模型。这类模型或许能够凭借强大的泛化能力,为多种应用场景提供支持,典型案例为Recursion。

第二类企业则选择跳过构建基础模型的步骤,聚焦具体的生物学场景,直接开发专门用于这些任务的特化细胞模型,典型案例为Asimov。

当然,这场革命才刚刚开始,一些专家表示,虚拟细胞距离真正落地仍有10-15年的时间,从模型预测到临床验证,从技术突破到伦理规范,虚拟细胞的发展还面临诸多挑战。

但可以确定的是,当生物学与人工智能深度融合,我们正站在新的起点——这不仅将深刻改变生物医药产业,更将重新定义人类对生命的认知

—The End—

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被“风油精”的邪修用法惊到了!两三块钱一瓶,竟有如此妙用

被“风油精”的邪修用法惊到了!两三块钱一瓶,竟有如此妙用

甜茶极简记
2026-05-28 19:02:43
特朗普专机前岿然不动的中国军人海外走红 国防部发声:动若雷霆,不动如山

特朗普专机前岿然不动的中国军人海外走红 国防部发声:动若雷霆,不动如山

每日经济新闻
2026-05-28 23:13:33
中国家门口生变,东盟11国选边站队,缅甸交权菲律宾,菲改了身份

中国家门口生变,东盟11国选边站队,缅甸交权菲律宾,菲改了身份

混沌录
2026-05-20 18:16:08
不断摊手抱怨队友,超级空位投不进!王博一句话让孙铭徽无地自容

不断摊手抱怨队友,超级空位投不进!王博一句话让孙铭徽无地自容

新杀猪的秀才
2026-06-01 00:38:45
姐姐嫁法国富商,妹妹嫁知名演员,姐妹俩年近50却都是冻龄女神

姐姐嫁法国富商,妹妹嫁知名演员,姐妹俩年近50却都是冻龄女神

往史过眼云烟
2026-05-24 14:25:24
61岁的王姬驾驭一身黑色礼服,这身材让年轻人都望尘莫及

61岁的王姬驾驭一身黑色礼服,这身材让年轻人都望尘莫及

大江
2026-05-24 12:20:25
2万八路军没打下500日军,揭开抗战史上最大争议

2万八路军没打下500日军,揭开抗战史上最大争议

浪子说
2026-05-29 17:09:29
34岁欧文亲承恢复99%!独行侠状元蓝图突生变数,湖人传闻遭重击

34岁欧文亲承恢复99%!独行侠状元蓝图突生变数,湖人传闻遭重击

热血体育社
2026-06-01 01:49:17
大陆已经行动,没收台当局“治权”,不到24小时,郑丽文立军令状

大陆已经行动,没收台当局“治权”,不到24小时,郑丽文立军令状

墨兰史书
2026-05-31 21:50:03
道心破碎?帕金斯:霍姆格伦不仅遭文班碾压,还被夺走了灵魂

道心破碎?帕金斯:霍姆格伦不仅遭文班碾压,还被夺走了灵魂

懂球帝
2026-05-31 15:38:12
重庆一凶宅以39万余元起价被法拍,拍卖公司:屋内曾发生非正常死亡事件

重庆一凶宅以39万余元起价被法拍,拍卖公司:屋内曾发生非正常死亡事件

极目新闻
2026-05-31 12:12:29
樊振东德甲夺冠发布会!全程英文,直指团队强大,谢队友助力成长

樊振东德甲夺冠发布会!全程英文,直指团队强大,谢队友助力成长

篮球资讯达人
2026-06-01 02:17:03
720马力V8!手动挡新车官宣:正式发布

720马力V8!手动挡新车官宣:正式发布

高科技爱好者
2026-05-31 22:47:11
中美日一季度GDP差距断崖,美国7.32万亿,日本1.02万亿

中美日一季度GDP差距断崖,美国7.32万亿,日本1.02万亿

又是美好的日子
2026-05-27 22:56:03
演员于笑白血病康复,在医院向医生女友求婚成功

演员于笑白血病康复,在医院向医生女友求婚成功

大象新闻
2026-05-31 17:16:59
特朗普年度体检报告:比去年增重超6公斤 “认知和身体状况非常好”

特朗普年度体检报告:比去年增重超6公斤 “认知和身体状况非常好”

每日经济新闻
2026-06-01 01:18:14
亨利怒怼阿尔特塔!阿森纳致命失误痛失欧冠,这操作太离谱

亨利怒怼阿尔特塔!阿森纳致命失误痛失欧冠,这操作太离谱

一隅非生
2026-05-31 06:48:12
1981年,陈伯达被判刑18年,出狱后提出唯一要求,组织:尽管提

1981年,陈伯达被判刑18年,出狱后提出唯一要求,组织:尽管提

瑾瑜聊情感
2025-07-04 18:06:06
有人正偷偷“篡改”抗战历史!他们想毁掉的,不只是30万人的记忆

有人正偷偷“篡改”抗战历史!他们想毁掉的,不只是30万人的记忆

浪子说
2026-05-30 00:05:05
最高可达37°C!济南市气象台发布高温黄色预警信号

最高可达37°C!济南市气象台发布高温黄色预警信号

鲁中晨报
2026-05-31 11:07:02
2026-06-01 05:19:00
智药局 incentive-icons
智药局
我们更懂药物创新
1191文章数 219关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

特朗普生日白宫办格斗赛 近距离观赛花超100万美元

头条要闻

特朗普生日白宫办格斗赛 近距离观赛花超100万美元

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

时尚
房产
家居
旅游
军事航空

梓渝:慢下来,也很好

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

家居要闻

云栖 舒展如流云

旅游要闻

半马苏河秀迎来“青春版”升级!校地联动解锁文商旅体展融合新玩法

军事要闻

解放军代表质问日防卫大臣:日本何时道歉

无障碍浏览 进入关怀版