OpenAI 发布首个生命科学模型 GPT-Rosalind|实验|生物学|openai|rosalind

OpenAI 发布首个生命科学模型 GPT-Rosalind

2026-04-17 17:45:20　来源: 赛博禅心

北京举报

分享至

PRODUCT

今天，OpenAI 发布了 GPT-Rosalind，定位是面向生物学、药物发现和转化医学的前沿推理模型

这是 OpenAI 推出的第一个生命科学方向专用模型，名字取自英国化学家 Rosalind Franklin，她当年的 X 射线衍射图像是 DNA 双螺旋结构被发现的关键证据

Codex 里的 GPT-Rosalind，模型选择器在右下

GPT-Rosalind 现在以 research preview 形式开放，需要走 OpenAI 的 trusted access 流程，目前只对美国境内合规的 Enterprise 客户开放。模型同时进 ChatGPT、Codex 和 API 三个入口

OpenAI 同步发了一个 Life Sciences 研究插件，免费给所有人用，能连超过 50 个科学工具和数据库。这个插件不需要走 trusted access，普通的 GPT 主线模型也能调用

OpenAI 在通用大模型路径之外，开了一条领域专精模型的产品线，GPT-Rosalind 是第一站

这个模型在做什么

GPT-Rosalind 不走通用对话模型微调的路子，OpenAI 把它定义为「生命科学系列」的第一个模型。强项集中在四类工作

→ 跨分子、蛋白、基因、通路和疾病相关生物学的推理

→ 多步骤的科研工作流，比如文献综述、序列到功能解释、实验规划、数据分析

→ 调用专业数据库和计算工具

→ 综合外部信息，提出后续实验设计

这些能力对应的是科研人员日常最耗时的一段，在大量文献、数据库、实验数据和不断迭代的假设之间反复切换。OpenAI 给出的判断是，目前一款新药从靶点发现到上市平均要 10 到 15 年，前期工作的效率每改善一点，整个链条都会受益

模型给出靶点取舍建议后，接着设计 96 孔板验证实验

Benchmark 怎么打的

OpenAI 公布了几个公开 benchmark 上的成绩

BixBench 是面向生物信息学和数据分析真实任务的 benchmark，GPT-Rosalind 拿了 0.751 的通过率，在已发布成绩的模型里领先

LABBench2 覆盖文献检索、数据库访问、序列处理、实验方案设计等研究任务。GPT-Rosalind 在 11 项里有 6 项超过 GPT-5.4，提升最大的是 CloningQA，要求端到端设计分子克隆所需的 DNA 和酶试剂

跟 Dyno Therapeutics 的合作评估是这次最值得看的一组数。Dyno 是做 AI 设计基因疗法的公司，他们用未发表、未污染的 RNA 序列测试模型在「序列到功能预测」和「序列生成」上的表现，对照的是 57 位 AI-bio 领域人类专家的历史成绩

模型在 Codex 应用里跑，best-of-ten 提交结果

→ 预测任务排名超过人类专家的 第 95 百分位

→ 序列生成任务排名约人类专家的 第 84 百分位

未发表数据这条很关键，它排除了模型背诵训练集的可能

那个免费插件

Life Sciences 研究插件已经放在 GitHub 上，今天就能用

Life Sciences 研究插件，六个研究方向 + 50 多个工具源

插件是一组模块化的 skill，覆盖人类遗传学、功能基因组学、蛋白结构、生物化学、临床证据和公开数据集六个常见研究方向。背后接的是超过 50 个公开的多组学数据库、文献源和生物学工具，给科研人员一个可重复使用的起点，蛋白结构查询、序列搜索、文献综述、公开数据集发现这些动作不用每次重新搭

不在 trusted access 里的用户也能用这个插件，只是后端会走 OpenAI 主线模型，不是 Rosalind。Enterprise 用户走 Rosalind，可以拿到更深的生物学推理

谁在用

OpenAI 列出的合作客户跨制药、生物技术、研究机构和基础设施供应商

Amgen、Novo Nordisk、Moderna、Thermo Fisher Scientific、Oracle Health and Life Sciences、NVIDIA、Allen Institute、Benchling、UCSF School of Pharmacy

几个高管在公告里给了表态

Amgen 的 AI 与数据高级副总裁 Sean Bruich 说这次合作能让公司用更先进的能力去加速药物送达患者的速度
Moderna CEO Stéphane Bancel 强调模型能在复杂生物证据之间做推理，把洞见转化成实验流程
NVIDIA 医疗与生命科学副总裁 Kimberly Powell 把这件事描述为「领域推理 + 加速计算」的合流
Allen Institute 的 CTO Andy Hickl 说 Rosalind 让数据查找和对齐这些手工步骤，在 agentic workflow 里更一致、更可重复
Los Alamos National Laboratory 也在联合 OpenAI 在做 AI 引导的蛋白和催化剂设计，包括让 AI 系统在保留或改进关键功能的前提下修改生物结构

为什么是 trusted access

这是这次发布里另一条值得停下来看的线

OpenAI 没有把 GPT-Rosalind 放到 ChatGPT Plus 或 API 公开层。trusted access 流程要求申请机构满足三条，从事有清晰公共健康收益的合法科研、维持治理与防滥用控制、把访问权限收敛在受控的合规环境里。模型本身也加了 enterprise-grade 的安全和访问管理控制，OpenAI 可以在 onboarding 或后续阶段额外索取信息

OpenAI Life Sciences 产品负责人 Yunyun Wang 在媒体简报里给的解释是，限制访问是为了在最大化使用价值的同时把误用风险压住

研究方向负责人 Joy Jiao 强调这套模型不用来替代科学家，目标是帮研究人员加速最耗时和分析密集的环节，最终的判断和验证仍然要科学家来做

几条结构性的事

讲完产品本身，几个值得单独标记的点

OpenAI 把 GPT-Rosalind 定义成「生命科学系列」的第一个，后续会有一条序列化的模型线展开。从架构上看，行业正在从「越大越通用」往「按领域做专门 reasoning 模型」走。OpenAI 之前在代码、视觉上做过类似的事，这次轮到生物

研究 preview 阶段使用 Rosalind 不消耗已有的 credits 和 token，OpenAI 说后续会公布定价和扩大可用范围的细节

普通用户和 VC 当下能立即上手的是那个免费插件。Rosalind 模型本身要有合规的科研使命才能拿到

参考材料

OpenAI 官方公告

https://openai.com/index/introducing-gpt-rosalind/

Life Sciences 研究插件 GitHub

https://github.com/openai/plugins/tree/main/plugins/life-science-research

trusted access 申请入口

https://openai.com/form/life-sciences-access

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.