网易首页 > 网易号 > 正文 申请入驻

直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner

0
分享至



作者 | 论文团队

编辑 | ScienceAI

面对多模态、跨尺度、强约束的科研问题,通用 LLM 正从「工具」升级为「合作者」。

来自上海人工智能实验室等机构的研究团队提出了一款为科学数据「读 — 思 — 设」而生的统一科学基座模型:以更完整的科学数据基座、更系统的训练日程与更可验证的推理机制,直击科学计算与设计痛点。



  • 论文:https://arxiv.org/pdf/2509.21320
  • 数据集:https://huggingface.co/SciReason
  • 模型:https://huggingface.co/SciReason
  • 代码:https://github.com/open-sciencelab/SciReason

它有三点最值得关注:

  • 覆盖更广:统一 I/O 与「任务分组奖励」让单一骨干跨化学 / 生命 / 材料等多领域;
  • 可验证性更强:从数据标注到思维链再到 RL 奖励全面「科学化」,强调度量统一与工具可复核;
  • 工程更到位:明确的数据配比、训练日程与算力规模,保证性能与可复现性。

更重要的是,这不是「做题型」模型的又一次包装:它以 206B 级多学科科学数据为基础,覆盖科学文本、纯科学序列(DNA/RNA/ 蛋白 / SMILES)、科学序列 — 文本 / 科学序列 — 科学序列成对数据,并在此之上统一建模、统一标注、统一度量,让「读 — 思 — 设」闭环可以被数据真实地驱动与校核。

科学数据「读 — 思 — 设」专精的基座模型

这是一套统一的科学推理基座:在 206B 级跨学科科学语料与数据上预训练,随后经「三段式」对齐 —— 大规模指令微调(≈4000 万样本)、退火式冷启动(诱导长链思维)、以及引入任务分组与连续化科学奖励的强化学习(DAPO)—— 把自然语言与异构科学表示(DNA/RNA/ 蛋白、分子 SMILES、材料结构与文本等)深度对齐,覆盖从文本↔科学格式互译、知识 / 要素抽取、性质预测 / 分类到序列生成与可约束设计在内的完整工作流,单模型覆盖 5 大能力,共 103 个子任务。



与「做题型模型」的区别:

  • 题库式 / 考试式模型:以高等教育考题数据为基础,侧重少量文本问答与模板化推导,缺少多表示科学数据(序列、符号、结构)的一致编码与可逆互译,无法直达科学研究一线。
  • 本模型 SciReasoner:以「文本+纯序列+序列 — 文本 / 序列 — 序列配对」的 AI-ready 科学数据做预训练母体;在后训练阶段统一 I/O 模式、统一标签域(如
  • ),并以物理 / 化学一致性的专业工具校验奖励和连续化奖励作为优化目标,确保推理与设计可被数据与度量反向约束。

三大方法学亮点

1)自适应科学推理(Adaptive Scientific Reasoning)

模型区分「即时型(instant)」与「思考型(thinking)」两类任务:前者保留直接答案监督,后者用思维链数据全量替换,确保在真正需要多步推理时给出连贯可查的理由,而简单任务保持高效直答。进一步的实证结论:在任务级别进行「思维链替换」优于在同一任务内混配 CoT 与非 CoT 目标,避免风格 / 长度不一致带来的校准偏移。

2)任务分组奖励(Task Grouped Rewarding)

将科学任务划分为距离度量型(数值预测)、匹配度量型(检索 / 抽取)与专业工具校验型三类,分别设计可比的质量度量与优势估计,提升跨任务的泛化与鲁棒性。

3)科学奖励「软化」(Scientific Reward Softening)

把原本难以优化的 0/1 正确性信号,统一映射为 [0,1] 的连续奖励(如把 BERTScore、RMSE 等标准量规规范化),显著改善复杂科学推理任务的收敛性与性能提升。



覆盖「全栈」科学智能

  • 五大能力家族:①文本↔科学表示的双向翻译;②文本 / 知识抽取;③性质回归预测;④性质分类;⑤序列生成与设计 —— 任务总量涵盖至 103 类。
  • 纵向对比:在 54 项任务上拿到 SOTA,并在 101 项任务里名列前二,显示统一骨干在跨学科迁移与端到端工作流覆盖上的优势。
  • 典型任务覆盖:分子表征互译(SMILES↔IUPAC/Formula)、分子描述 / 图说、蛋白功能翻译、跨模态知识抽取到材料 / 生物 / 化学性质预测与分类,再到约束可控的序列与材料 / 分子设计,强调「可逆性、守恒性、可检验性」的科学语义保真。



能落地到哪些场景

  • 药物与分子设计:以性质回归 / 分类为「筛」,可控序列 / 分子生成为「设」,工具校验与知识检索为「评」,构成「筛 — 设 — 评」的可迭代数据闭环,降低无效合成与实验成本。
  • 蛋白 / 核酸工程:从功能 / 本体描述与信息抽取,到稳定性 / 可溶性等属性预测,再到定向序列设计,兼顾规则约束与可达性。
  • 材料科学:围绕文本 — 结构 — 数值三证据链开展性质回归 / 分类与候选筛选,适配主流数据库字段与口径。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拟聘用4人均毕业于国外高校,遭质疑“萝卜岗”,邯郸学院回应:只是凑巧,面试10人,拟聘4人

拟聘用4人均毕业于国外高校,遭质疑“萝卜岗”,邯郸学院回应:只是凑巧,面试10人,拟聘4人

扬子晚报
2026-01-21 19:15:36
许家印交代了?一年3000万,养了60名恒大歌舞团,提供3大服务!

许家印交代了?一年3000万,养了60名恒大歌舞团,提供3大服务!

猫叔东山再起
2026-01-22 10:20:02
-14℃!又要下雪!新一轮雨雪即将抵达安徽

-14℃!又要下雪!新一轮雨雪即将抵达安徽

鲁中晨报
2026-01-22 14:35:09
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
“后坐力”太大!闫学晶又被爆出猛料,她和儿子已经一个也跑不了

“后坐力”太大!闫学晶又被爆出猛料,她和儿子已经一个也跑不了

翰飞观事
2026-01-21 19:27:58
四川省5天5名厅官被查

四川省5天5名厅官被查

上观新闻
2026-01-22 06:42:08
毛主席下令“丢卒保车”保全大局,皮定均率七千将领甘愿当小卒

毛主席下令“丢卒保车”保全大局,皮定均率七千将领甘愿当小卒

古书记史
2026-01-19 01:30:53
点球打飞 63岁穆帅低头认命!欧冠末轮死磕皇马 输球就出局

点球打飞 63岁穆帅低头认命!欧冠末轮死磕皇马 输球就出局

叶青足球世界
2026-01-22 10:02:57
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
不打了!广东强力外援确认下家,朱芳雨彻底失去“后路”!

不打了!广东强力外援确认下家,朱芳雨彻底失去“后路”!

绯雨儿
2026-01-22 11:56:27
A股:今天涨到4122,做好准备,明天周五股市行情分析!

A股:今天涨到4122,做好准备,明天周五股市行情分析!

明心
2026-01-22 15:37:43
深圳多区有人被查!警方提醒

深圳多区有人被查!警方提醒

深圳晚报
2026-01-21 20:57:47
一支笔锁死中国14亿人命运:为何90年过去了,这条斜线谁也动不了

一支笔锁死中国14亿人命运:为何90年过去了,这条斜线谁也动不了

半解智士
2026-01-20 18:03:00
13投砍40分!抱歉克莱:你从历史第二变成了历史第三

13投砍40分!抱歉克莱:你从历史第二变成了历史第三

篮球大视野
2026-01-21 18:30:19
第一集就得打码,这部HBO美剧太生猛了

第一集就得打码,这部HBO美剧太生猛了

来看美剧
2026-01-21 23:45:23
近1200万手封死跌停,AI应用龙头!业绩大增股价大跌,发生了什么?

近1200万手封死跌停,AI应用龙头!业绩大增股价大跌,发生了什么?

数据宝
2026-01-22 12:49:42
原来马斯克没说错,全球抢的不是芯片,而是中国20万一台的变压器

原来马斯克没说错,全球抢的不是芯片,而是中国20万一台的变压器

云上乌托邦
2026-01-22 13:10:38
俄罗斯遭大规模袭击

俄罗斯遭大规模袭击

鲁中晨报
2026-01-22 15:31:02
一份假公证书引发的“继承之战”:西安翻译学院已故创始人两女儿争夺“举办者身份”,一审宣判后3名原告上诉

一份假公证书引发的“继承之战”:西安翻译学院已故创始人两女儿争夺“举办者身份”,一审宣判后3名原告上诉

极目新闻
2026-01-21 21:50:59
国家统计局:去年12月不包含在校生的16-24岁劳动力失业率16.5%,连续4个月下降

国家统计局:去年12月不包含在校生的16-24岁劳动力失业率16.5%,连续4个月下降

澎湃新闻
2026-01-22 11:27:31
2026-01-22 18:20:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1215文章数 223关注度
往期回顾 全部

科技要闻

几千亿只是开胃菜,AI基建还得再砸几万亿

头条要闻

女大学生白血病病危 确诊一月后发现自己非父母亲生

头条要闻

女大学生白血病病危 确诊一月后发现自己非父母亲生

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

钟丽缇土耳其高空落泪 与张伦硕拥吻

财经要闻

申通快递创始人被前夫索要股份

汽车要闻

配备多块娱乐屏 极氪8X内饰曝光

态度原创

亲子
健康
数码
艺术
公开课

亲子要闻

牛奶过敏 vs 乳糖不耐受:家长如何辨别与科学应对

打工人年终总结!健康通关=赢麻了

数码要闻

英特尔即将推出搭载BMG-G31芯片的Arc Pro B70显卡

艺术要闻

一场雪,飘进了唐诗

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版