网易首页 > 网易号 > 正文 申请入驻

OpenAI发现:GPT-4b micro改造诺奖研究,山中因子重编程效率提高

0
分享至




机器之心报道

机器之心编辑部

AI 加速科学和药物研发,已经不是什么新鲜事,但它的潜力远未被完全释放。

就在刚刚过去的一天,OpenAI 宣布他们与生物科技初创公司 Retro Bio 合作,研发的新模型GPT-4b micro,设计出了新型且显著增强的山中因子变体。

山中因子是一组蛋白质,由诺奖得主、日本科学家山中伸弥在 2006 年提出,其包括 Oct4、Sox2、Klf4 和 c - Myc4 种因子,又称 OSKM。当它们被添加到人类皮肤细胞中时,会使其转变为看似年轻的干细胞,这种干细胞可以分化成体内任何其他组织。Retro 认为,这一现象可能是实现构建人体器官或提供替代细胞的起点。

然而,山中因子也存在一个重大局限:重编程效率极低,它需要数周时间,而且在实验室培养皿中,只有不到 1% 的细胞能够完成再生之旅。这意味着在实际应用中,只有极少数细胞能够成功被重编程,这大大限制了其在临床和科研上的推广与应用价值。

OpenAI 与 Retro Bio 团队借助 GPT-4b micro,一起设计出山中因子新变体,与标准 OSKM 蛋白相比,这些因子在体外的重编程效率提高了 50 倍,这是一项突破性的改进。



其实,OpenAI 与 Retro Bio 的合作始于一年前,此前, Sam Altman 个人向 Retro 注资 1.8 亿美元。

对于这一发现,Sam Altman、Greg Brockman 纷纷进行了转发并评论:





不过遗憾的是,这个模型并没公开:



OpenAI 表示,GPT-4b micro 与 GPT-4o 具有相同的架构,但使用了一种新的训练方法和自定义生物学数据集,目的是使科学家能够根据自己的需求重新设计蛋白质。



山中因子 KLF4(左)和 SOX2(右)的 3D 结构可视化。

模型在推理过程中能够处理上下文长度达 64000 个 token ,尽管这种规模在文本大语言模型中已较为常见,但在蛋白质序列模型中尚属首次。

另外,值得一提的是,在开发过程中,研究者观察到 GPT-4b micro 出现了与语言模型类似的 scaling laws,在更大的数据集上训练的模型在困惑度和下游蛋白质基准方面取得了可预测的提升。然而,蛋白质 AI 模型的计算机模拟评估通常价值有限,因为尚不清楚此类改进是否能转化为现实世界中效用的提升。

用 AI 辅助对 SOX2 和 KLF4 重新设计

显著提升干细胞重编程效率

OpenAI 展示了是如何借助 GPT-4b micro 来提升 SOX2 和 KLF4 重编程效率的。

众所周知,直接对蛋白质序列进行优化非常困难,因为 SOX2 含有 317 个氨基酸、KLF4 含有 513 个氨基酸,可能产生的变体数量几乎达到 10^1000,所以传统的「定向进化」筛选技术每次仅能对少量残基进行突变,所能探索的设计空间可谓是微不足道。

几年前的一项权威学术研究成果《通过细胞选择和测序实现重编程因子的定向进化》测试了数千种 SOX2 突变体,只发现少数具有适度增益的三重突变体,而 15 年来对嵌合 SOX⁠蛋白的不懈研究所获得的变体,与天然 SOX 仅有 5 个残基的差异。

为此,Retro 团队使用人类成纤维细胞(皮肤和结缔组织)搭建了一个湿实验室筛选平台,在初步筛选阶段,使用 Retro 科学家手动设计的 OSKM 和 SOX2 变体作为基线对其进行验证,如图 3 所示。

然后,研究者要求 GPT-4b micro 提出一组多样化的「RetroSOX」序列。结果发现,尽管模型提出的序列平均与野生型 SOX2(wild‑type SOX2)之间相差超过 100 个氨基酸,但在表达关键多能性标记物方面,该模型提出的序列中超过 30% 的序列都要优于野生型 SOX2。而相比之下,传统筛选方法的命中率通常低于 10%。



随后,研究团队对山中因子中最大的 KLF4 进行重新改造。已知 KLF4 可以被其他 KLF 家族因子替代,但不会提高重编程效率。此前,在通过专家指导的单氨基酸替换方案对 KLF4 进行改进尝试时,19 次尝试中仅成功一次。

与对 RetroSOX 的改进方法类似,研究者要求模型生成一组增强型 RetroKLF 变体。结果就是,在模型生成的变体中,有 14 种变体要优于 RetroSOX 筛选中的最佳组合 —— 命中率接近 50%,如图 4 所示。



该研究发现,将表现最优的 RetroSOX 和 RetroKLF 变体组合在一起可获得最显著的成效。而在三次独立实验中,成纤维细胞早期 (SSEA-4) 和晚期 (TRA-1-60、NANOG) 标志物均显著增加,且晚期标志物的出现时间比野生型 OSKM 组合方案提前了几天,如图 5 所示。



此外,在第 10 天通过碱性磷酸酶 (AP) 染色验证时发现,RetroSOX 和 RetroKLF 变体不仅表达晚期多能性标记,还表现出强劲得到 AP 活性,而这是多能性的重要指标,如图 6 所示。



为了进一步证实重编程效率的提升并探索其临床潜力,研究者采用不同的递送方式验证 —— 用 mRNA 替代病毒载体,以及另一种细胞类型 —— 间充质基质细胞 (MSC),进行验证。(注:这些细胞来自三位年龄超过 50 岁的中年人类捐赠者)

结果发现,仅仅 7 天内,超过 30% 的细胞开始表达关键多能性标志物(SSEA4 和 TRA-1-60),等到第 12 天时,出现了大量形态与典型诱导性多能干细胞(iPSC)相似的细胞集落,如图 7 的左侧和中间所示。这些细胞中有超过 85% 激活了关键干细胞标志物的内源性表达,包括 OCT4、NANOG、SOX2 和 TRA-1-60。

随后,研究者验证了这些 RetroFactor 衍生的 iPSC 能够成功分化为所有三个原始胚层 —— 内胚层、外胚层和中胚层。此外,他们扩增了多个单克隆 iPSC 细胞系,并进行了多次传代,证实了其具有健康的核型(如图 7 的右侧所示),且基因组稳定性适合细胞治疗。

这些结果进一步佐证了工程化变体的稳健性,还为跨不同递送方式和细胞类型增强 iPSC 生成能力提供了实证依据。



根据研究结果综合来看,高命中率、深度序列编辑、加速标记出现和 AP + 菌落形成等证据初步表明:AI 指导的蛋白质设计可以显著加速干细胞重编程研究的研究发展进展。

重组变体增强 DNA 损伤修复

在 DNA 损伤修复试验中,用 RetroSOX/KLF 混合物处理的细胞表现出明显低于用标准 OSKM 或荧光对照重编程的细胞的 γ-H2AX 强度(双链断裂的标志)(图 8)。

这些结果表明,RetroSOX/KLF 混合物比原始的山中因子更有效地减少 DNA 损伤。



未来展望

对 OpenAI 来说,这项工作证明了,在特定领域,专业化模型能够更快地在科学问题上取得突破性进展。

「当研究人员将深厚的领域知识与语言模型工具结合时,以前需要数年才能解决的问题,可能在数天之内就会取得进展。」OpenAI 研究合作负责人 Boris Power 说道。

参考链接:https://openai.com/index/accelerating-life-sciences-research-with-retro-biosciences/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

寄史言志
2026-01-04 16:34:31
跳台滑雪爆作弊疑云,德媒:有选手疑打玻尿酸增大下体冀获优势,

跳台滑雪爆作弊疑云,德媒:有选手疑打玻尿酸增大下体冀获优势,

环球趣闻分享
2026-01-19 13:40:06
中国军工太“狠”,比苏联还苏联,比西方更西方,关键还坚持本我

中国军工太“狠”,比苏联还苏联,比西方更西方,关键还坚持本我

老范谈史
2026-01-19 20:46:26
1-2爆大冷!郑钦文宿敌出局,惨遭一轮游,大满贯冠军0-2遭淘汰

1-2爆大冷!郑钦文宿敌出局,惨遭一轮游,大满贯冠军0-2遭淘汰

体育就你秀
2026-01-19 11:19:58
为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

带你感受人间冷暖
2025-11-04 16:38:29
梁山108将其实分成5个山头,每个山头带头大哥是谁?哪拨最厉害?

梁山108将其实分成5个山头,每个山头带头大哥是谁?哪拨最厉害?

长风文史
2026-01-19 15:08:23
携程被立案调查后股价跌幅已超20%,业内人士称本月初,携程已悄然调整酒旅商家挂牌展示规则

携程被立案调查后股价跌幅已超20%,业内人士称本月初,携程已悄然调整酒旅商家挂牌展示规则

中国能源网
2026-01-20 08:08:17
弗拉格18+7+3湖人弃将8记三分,布伦森打铁,独行侠复仇尼克斯

弗拉格18+7+3湖人弃将8记三分,布伦森打铁,独行侠复仇尼克斯

钉钉陌上花开
2026-01-20 08:38:44
西贝老板的军师遭曝光:原来是大V“理记”,他让贾国龙干罗永浩

西贝老板的军师遭曝光:原来是大V“理记”,他让贾国龙干罗永浩

汉史趣闻
2026-01-17 16:25:30
特朗普尴尬了,要不用直升机把马杜罗再送回去吧。

特朗普尴尬了,要不用直升机把马杜罗再送回去吧。

百态人间
2026-01-19 15:22:57
河南一学生教室内用板凳攻击同学后脑,学校称没视频上严重,警方:只是看着动作比较大

河南一学生教室内用板凳攻击同学后脑,学校称没视频上严重,警方:只是看着动作比较大

扬子晚报
2026-01-19 14:16:20
家属称男子三年前右脑出血被开左脑,医生发现出错又开右脑 希望认定责任、赔偿并追责

家属称男子三年前右脑出血被开左脑,医生发现出错又开右脑 希望认定责任、赔偿并追责

红星新闻
2026-01-19 11:47:22
“贾玲好瘦啊”登上热搜,网友:还以为是张小斐

“贾玲好瘦啊”登上热搜,网友:还以为是张小斐

红星新闻
2026-01-18 11:47:30
117-110 掀翻 4 连胜国王!克林根 21+17 封神,杨瀚森以他为目标

117-110 掀翻 4 连胜国王!克林根 21+17 封神,杨瀚森以他为目标

刘哥谈体育
2026-01-20 08:08:46
赢麻了!中国电信狂揽史上超级大单

赢麻了!中国电信狂揽史上超级大单

通信头条
2026-01-18 18:50:49
美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

心灵短笛
2025-05-12 10:05:25
世界上最离谱的午饭都在滑雪场

世界上最离谱的午饭都在滑雪场

穷游网
2026-01-19 18:20:10
章子怡糊涂啊!近照肿成面包超人,最具特色的骨相优势都没了

章子怡糊涂啊!近照肿成面包超人,最具特色的骨相优势都没了

萌神木木
2026-01-19 18:15:42
有意思!兄弟俩同台,哥哥0分,正负值+12;弟弟16分,正负值-20

有意思!兄弟俩同台,哥哥0分,正负值+12;弟弟16分,正负值-20

金山话体育
2026-01-20 05:05:27
40余家上市公司净利翻番 AI成业绩增长强大驱动力

40余家上市公司净利翻番 AI成业绩增长强大驱动力

财联社
2026-01-20 06:40:33
2026-01-20 09:24:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12147文章数 142546关注度
往期回顾 全部

科技要闻

去年预亏60亿后再投百亿 两大车企紧抱华为

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

头条要闻

女子订3间双床房被告知是3张单人床 退订扣80%违约金

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

2026股市猜想

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

艺术
本地
房产
旅游
公开课

艺术要闻

瑞典艺术大师,佐恩人物作品精选19幅

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

旅游要闻

重庆黔江:峡谷梅香引客来

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版