网易首页 > 网易号 > 正文 申请入驻

直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner

0
分享至



作者 | 论文团队

编辑 | ScienceAI

面对多模态、跨尺度、强约束的科研问题,通用 LLM 正从「工具」升级为「合作者」。

来自上海人工智能实验室等机构的研究团队提出了一款为科学数据「读 — 思 — 设」而生的统一科学基座模型:以更完整的科学数据基座、更系统的训练日程与更可验证的推理机制,直击科学计算与设计痛点。



  • 论文:https://arxiv.org/pdf/2509.21320
  • 数据集:https://huggingface.co/SciReason
  • 模型:https://huggingface.co/SciReason
  • 代码:https://github.com/open-sciencelab/SciReason

它有三点最值得关注:

  • 覆盖更广:统一 I/O 与「任务分组奖励」让单一骨干跨化学 / 生命 / 材料等多领域;
  • 可验证性更强:从数据标注到思维链再到 RL 奖励全面「科学化」,强调度量统一与工具可复核;
  • 工程更到位:明确的数据配比、训练日程与算力规模,保证性能与可复现性。

更重要的是,这不是「做题型」模型的又一次包装:它以 206B 级多学科科学数据为基础,覆盖科学文本、纯科学序列(DNA/RNA/ 蛋白 / SMILES)、科学序列 — 文本 / 科学序列 — 科学序列成对数据,并在此之上统一建模、统一标注、统一度量,让「读 — 思 — 设」闭环可以被数据真实地驱动与校核。

科学数据「读 — 思 — 设」专精的基座模型

这是一套统一的科学推理基座:在 206B 级跨学科科学语料与数据上预训练,随后经「三段式」对齐 —— 大规模指令微调(≈4000 万样本)、退火式冷启动(诱导长链思维)、以及引入任务分组与连续化科学奖励的强化学习(DAPO)—— 把自然语言与异构科学表示(DNA/RNA/ 蛋白、分子 SMILES、材料结构与文本等)深度对齐,覆盖从文本↔科学格式互译、知识 / 要素抽取、性质预测 / 分类到序列生成与可约束设计在内的完整工作流,单模型覆盖 5 大能力,共 103 个子任务。



与「做题型模型」的区别:

  • 题库式 / 考试式模型:以高等教育考题数据为基础,侧重少量文本问答与模板化推导,缺少多表示科学数据(序列、符号、结构)的一致编码与可逆互译,无法直达科学研究一线。
  • 本模型 SciReasoner:以「文本+纯序列+序列 — 文本 / 序列 — 序列配对」的 AI-ready 科学数据做预训练母体;在后训练阶段统一 I/O 模式、统一标签域(如
  • ),并以物理 / 化学一致性的专业工具校验奖励和连续化奖励作为优化目标,确保推理与设计可被数据与度量反向约束。

三大方法学亮点

1)自适应科学推理(Adaptive Scientific Reasoning)

模型区分「即时型(instant)」与「思考型(thinking)」两类任务:前者保留直接答案监督,后者用思维链数据全量替换,确保在真正需要多步推理时给出连贯可查的理由,而简单任务保持高效直答。进一步的实证结论:在任务级别进行「思维链替换」优于在同一任务内混配 CoT 与非 CoT 目标,避免风格 / 长度不一致带来的校准偏移。

2)任务分组奖励(Task Grouped Rewarding)

将科学任务划分为距离度量型(数值预测)、匹配度量型(检索 / 抽取)与专业工具校验型三类,分别设计可比的质量度量与优势估计,提升跨任务的泛化与鲁棒性。

3)科学奖励「软化」(Scientific Reward Softening)

把原本难以优化的 0/1 正确性信号,统一映射为 [0,1] 的连续奖励(如把 BERTScore、RMSE 等标准量规规范化),显著改善复杂科学推理任务的收敛性与性能提升。



覆盖「全栈」科学智能

  • 五大能力家族:①文本↔科学表示的双向翻译;②文本 / 知识抽取;③性质回归预测;④性质分类;⑤序列生成与设计 —— 任务总量涵盖至 103 类。
  • 纵向对比:在 54 项任务上拿到 SOTA,并在 101 项任务里名列前二,显示统一骨干在跨学科迁移与端到端工作流覆盖上的优势。
  • 典型任务覆盖:分子表征互译(SMILES↔IUPAC/Formula)、分子描述 / 图说、蛋白功能翻译、跨模态知识抽取到材料 / 生物 / 化学性质预测与分类,再到约束可控的序列与材料 / 分子设计,强调「可逆性、守恒性、可检验性」的科学语义保真。



能落地到哪些场景

  • 药物与分子设计:以性质回归 / 分类为「筛」,可控序列 / 分子生成为「设」,工具校验与知识检索为「评」,构成「筛 — 设 — 评」的可迭代数据闭环,降低无效合成与实验成本。
  • 蛋白 / 核酸工程:从功能 / 本体描述与信息抽取,到稳定性 / 可溶性等属性预测,再到定向序列设计,兼顾规则约束与可达性。
  • 材料科学:围绕文本 — 结构 — 数值三证据链开展性质回归 / 分类与候选筛选,适配主流数据库字段与口径。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

街声巷闻
2025-11-17 14:36:54
惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

电动猫
2025-11-18 00:18:26
聚焦“十五五”规划建议|保持制造业合理比重

聚焦“十五五”规划建议|保持制造业合理比重

新华社
2025-11-17 15:54:02
王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

懂球帝
2025-11-18 17:17:31
张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

极目新闻
2025-11-18 15:19:03
捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

鹰眼Defence
2025-11-18 17:53:12
捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

南宫一二
2025-11-17 07:17:39
全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

带你逛体坛
2025-11-18 18:34:10
罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

懂球帝
2025-11-18 14:25:08
日韩股市,开盘暴跌!

日韩股市,开盘暴跌!

证券时报
2025-11-18 09:47:04
湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

体育妞世界
2025-11-18 14:08:30
乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

君好伴读
2025-10-27 10:33:08
付某梅(女),已被大连警方抓获归案!

付某梅(女),已被大连警方抓获归案!

半岛晨报
2025-11-18 12:40:05
因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

起喜电影
2025-11-18 15:29:35
赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

火山诗话
2025-11-18 18:36:08
华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

手机中国
2025-11-18 16:50:44
钟丽缇168cm的大块头,一般男人征服不了她吧?

钟丽缇168cm的大块头,一般男人征服不了她吧?

小椰的奶奶
2025-11-18 13:14:26
毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

南书房
2025-09-28 23:01:03
日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

收藏大视界
2025-11-09 20:38:12
只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

乡野小珥
2025-11-18 07:31:38
2025-11-18 19:39:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1155文章数 218关注度
往期回顾 全部

科技要闻

小米:汽车及AI等业务首次单季度经营盈利

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

搭载1.5T增程动力 吉利银河V900官图发布

态度原创

艺术
教育
数码
游戏
公开课

艺术要闻

优雅浪漫的绘画,美到让人想直接住进去!

教育要闻

论区老师“拗柴”与中考体育满分之间的逻辑必然性

数码要闻

天马全球首发真610Hz无极电竞屏,还有108英寸4K巨幕Micro LED

米哈游改革?离开二游 不做抽卡 还能创造奇迹吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版