PRODUCT
今天,OpenAI 发布了 GPT-Rosalind,定位是面向生物学、药物发现和转化医学的前沿推理模型
这是 OpenAI 推出的第一个生命科学方向专用模型,名字取自英国化学家 Rosalind Franklin,她当年的 X 射线衍射图像是 DNA 双螺旋结构被发现的关键证据
Codex 里的 GPT-Rosalind,模型选择器在右下
GPT-Rosalind 现在以 research preview 形式开放,需要走 OpenAI 的 trusted access 流程,目前只对美国境内合规的 Enterprise 客户开放。模型同时进 ChatGPT、Codex 和 API 三个入口
OpenAI 同步发了一个 Life Sciences 研究插件,免费给所有人用,能连超过 50 个科学工具和数据库。这个插件不需要走 trusted access,普通的 GPT 主线模型也能调用
OpenAI 在通用大模型路径之外,开了一条领域专精模型的产品线,GPT-Rosalind 是第一站
这个模型在做什么
GPT-Rosalind 不走通用对话模型微调的路子,OpenAI 把它定义为「生命科学系列」的第一个模型。强项集中在四类工作
→ 跨分子、蛋白、基因、通路和疾病相关生物学的推理
→ 多步骤的科研工作流,比如文献综述、序列到功能解释、实验规划、数据分析
→ 调用专业数据库和计算工具
→ 综合外部信息,提出后续实验设计
这些能力对应的是科研人员日常最耗时的一段,在大量文献、数据库、实验数据和不断迭代的假设之间反复切换。OpenAI 给出的判断是,目前一款新药从靶点发现到上市平均要 10 到 15 年,前期工作的效率每改善一点,整个链条都会受益
模型给出靶点取舍建议后,接着设计 96 孔板验证实验
Benchmark 怎么打的
OpenAI 公布了几个公开 benchmark 上的成绩
BixBench 是面向生物信息学和数据分析真实任务的 benchmark,GPT-Rosalind 拿了 0.751 的通过率,在已发布成绩的模型里领先
LABBench2 覆盖文献检索、数据库访问、序列处理、实验方案设计等研究任务。GPT-Rosalind 在 11 项里有 6 项超过 GPT-5.4,提升最大的是 CloningQA,要求端到端设计分子克隆所需的 DNA 和酶试剂
跟 Dyno Therapeutics 的合作评估是这次最值得看的一组数。Dyno 是做 AI 设计基因疗法的公司,他们用未发表、未污染的 RNA 序列测试模型在「序列到功能预测」和「序列生成」上的表现,对照的是 57 位 AI-bio 领域人类专家的历史成绩
模型在 Codex 应用里跑,best-of-ten 提交结果
→ 预测任务排名超过人类专家的 第 95 百分位
→ 序列生成任务排名约人类专家的 第 84 百分位
未发表数据这条很关键,它排除了模型背诵训练集的可能
那个免费插件
Life Sciences 研究插件已经放在 GitHub 上,今天就能用
![]()
Life Sciences 研究插件,六个研究方向 + 50 多个工具源
插件是一组模块化的 skill,覆盖人类遗传学、功能基因组学、蛋白结构、生物化学、临床证据和公开数据集六个常见研究方向。背后接的是超过 50 个公开的多组学数据库、文献源和生物学工具,给科研人员一个可重复使用的起点,蛋白结构查询、序列搜索、文献综述、公开数据集发现这些动作不用每次重新搭
不在 trusted access 里的用户也能用这个插件,只是后端会走 OpenAI 主线模型,不是 Rosalind。Enterprise 用户走 Rosalind,可以拿到更深的生物学推理
谁在用
OpenAI 列出的合作客户跨制药、生物技术、研究机构和基础设施供应商
Amgen、Novo Nordisk、Moderna、Thermo Fisher Scientific、Oracle Health and Life Sciences、NVIDIA、Allen Institute、Benchling、UCSF School of Pharmacy
几个高管在公告里给了表态
Amgen 的 AI 与数据高级副总裁 Sean Bruich 说这次合作能让公司用更先进的能力去加速药物送达患者的速度
Moderna CEO Stéphane Bancel 强调模型能在复杂生物证据之间做推理,把洞见转化成实验流程
NVIDIA 医疗与生命科学副总裁 Kimberly Powell 把这件事描述为「领域推理 + 加速计算」的合流
Allen Institute 的 CTO Andy Hickl 说 Rosalind 让数据查找和对齐这些手工步骤,在 agentic workflow 里更一致、更可重复
Los Alamos National Laboratory 也在联合 OpenAI 在做 AI 引导的蛋白和催化剂设计,包括让 AI 系统在保留或改进关键功能的前提下修改生物结构
为什么是 trusted access
这是这次发布里另一条值得停下来看的线
OpenAI 没有把 GPT-Rosalind 放到 ChatGPT Plus 或 API 公开层。trusted access 流程要求申请机构满足三条,从事有清晰公共健康收益的合法科研、维持治理与防滥用控制、把访问权限收敛在受控的合规环境里。模型本身也加了 enterprise-grade 的安全和访问管理控制,OpenAI 可以在 onboarding 或后续阶段额外索取信息
OpenAI Life Sciences 产品负责人 Yunyun Wang 在媒体简报里给的解释是,限制访问是为了在最大化使用价值的同时把误用风险压住
研究方向负责人 Joy Jiao 强调这套模型不用来替代科学家,目标是帮研究人员加速最耗时和分析密集的环节,最终的判断和验证仍然要科学家来做
几条结构性的事
讲完产品本身,几个值得单独标记的点
OpenAI 把 GPT-Rosalind 定义成「生命科学系列」的第一个,后续会有一条序列化的模型线展开。从架构上看,行业正在从「越大越通用」往「按领域做专门 reasoning 模型」走。OpenAI 之前在代码、视觉上做过类似的事,这次轮到生物
研究 preview 阶段使用 Rosalind 不消耗已有的 credits 和 token,OpenAI 说后续会公布定价和扩大可用范围的细节
普通用户和 VC 当下能立即上手的是那个免费插件。Rosalind 模型本身要有合规的科研使命才能拿到
参考材料
OpenAI 官方公告
https://openai.com/index/introducing-gpt-rosalind/
Life Sciences 研究插件 GitHub
https://github.com/openai/plugins/tree/main/plugins/life-science-research
trusted access 申请入口
https://openai.com/form/life-sciences-access
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.