网易首页 > 网易号 > 正文 申请入驻

迈向AI4S 2.0,书生Intern-S1-Pro万亿MoE科学大模型开源

0
分享至


始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区,始终坚持“中立、开放、共建、共创、合作”五项基本原则,欢迎加入共同成长。

2月4日,上海人工智能实验室开源基于“通专融合”技术架构SAGE打造的万亿参数科学多模态大模型 Intern-S1-Pro,为AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代,提供创新的系统性开源基座。

作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro的核心科学能力实现了质的跃升,高难度综合学科评测稳居AI4S领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。

此次发布的Intern-S1-Pro是通过SAGE实现 “可深度专业化通用模型” 的关键实践。该模型基于混合专家架构(MoE),共拥有512个专家,总参数达1T,每次调用仅激活8个专家、22B参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:在SAGE的基础模型层,通过引入傅里叶位置编码①并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;通过高效路由机制,系统攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了关键的工程基础。

与此同时,Intern-S1-Pro验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的AGI4S基础设施奠定了坚实底座。通过开源开放,Intern-S1-Pro旨在降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命。模型已经发布在始智AI wisemodel开源社区应用空间(wisemodel.cn/apps也将可以直接在线体验,欢迎前往了解和尝试。


模型地址

https://wisemodel.cn/models/Intern/Intern-S1-Pro


01.

创新底层架构:

突破万亿参数科学模型边界

上海人工智能实验室主任、首席科学家周伯文提出:可深度专业化通用模型(Specializable Generalist)是实现AGI的可行路径,其关键挑战在于:专家化模型在训练过程中需要低成本、能规模化的密集反馈;能够持续不断地学习与主动探索,并具备为同一个问题提供多视角、多种解决方案的能力;并能引入对物理世界规律的考量,兼顾多项差异化能力的学习效率与性能。

Intern-S1-Pro通过多项SAGE基础模型层的技术创新,拓宽了模型应用边界、提升了超大规模训练可行性,推进了可深度专业化通用模型的探索。

为构建能更深层次理解物理世界规律的科学大模型,研究团队引入了傅里叶位置编码(FoPE)重构时序编码器。FoPE为AI赋予双重视角:既能像看“粒子”一样捕捉文字之间的相对距离,又能像分析“波”一样把握科学信号的整体规律与频率。科学数据与语言的差异还体现在多尺度上,基于能自动适应数据密度的时序编码器,模型首次能统一处理从寥寥数个到百万级采样的各类信号,支持的分析对象从天文、地理直接拓展至生理信号、生物声学等领域,从而实现感知能力的重大跃迁。

为了高效训练承载这些能力的万亿参数超大规模模型,研究团队革新了其内部的“路由机制”。传统方法存在训练低效和算力浪费两大痛点。新技术通过 “路由稠密估计” ,让模型在高效运行的同时能进行更充分的学习,提升了稳定性;进而通过 “分组路由”策略,像智能交通系统一样使海量计算芯片实现负载均衡,避免了资源闲置。通过算法与系统的协同创新,同时攻克了超大规模模型训练在“学习效率”和“资源调度”上的核心瓶颈,为高效、稳健地训练下一代万亿参数模型提供了关键基础。

通过上述底层架构的创新,Intern-S1-Pro不仅在规模上刷新了科学多模态模型的参数规模上限,也为SAGE架构所提出的“通用能力与专业能力协同演进”提供了可落地的实现路径。

02.

科学能力再进化,通用能力协同演进

得益于创新的底层架构设计与万亿参数超大规模训练策略,Intern-S1-Pro的科学能力进一步升级。

在国际数学奥林匹克IMO-Answer-Bench和国际物理奥林匹克IPhO2025两大权威基准测试中,Intern-S1-Pro均展现出竞赛级别的解题能力。

在AI4S关键垂类领域,Intern-S1-Pro成功构建了一个跨越化学、材料、生命、地球、物理五大核心学科的全谱系能力矩阵,涵盖100多个专业子任务,不仅在Mol-Instruction、Biology-Instruction等单学科垂类评测中表现优异,更在SciReasoner等高难度的综合学科评测基准中,取得了与闭源商业大模型及垂类SOTA模型相当,甚至更优的成绩,稳居AI4S领域的第一梯队

在基础理解维度,Intern-S1-Pro基于高精度多模态感知能力,能够精准解析复杂的分子结构图及各类实验图表,深入到逻辑推理层面 ,Intern-S1-Pro能够处理高阶科学问答,如反应条件推断、理化性质预测,精准捕捉数据背后的因果规律等。随着理解与推理能力的持续增强,Intern-S1-Pro的能力边界不断向真实科研场景延伸,其应用范围从微观层面的化学逆合成、蛋白质序列生成,拓展至宏观尺度的遥感图像分析等复杂任务。通过XLRS-Bench等真实科研场景评测,模型展现出从“解题”迈向“解决问题”的科研生产力价值,为前沿科学探索提供了坚实支撑。

同时,借助通专融合技术路线,Intern-S1-Pro在通用能力与专业科学能力上实现协同进阶:在图文跨模态理解、科学图表逻辑推理、多场景视觉感知,以及高质量自然语言生成和复杂指令精准遵循等核心维度,Intern-S1-Pro均稳居开源模型阵营第一梯队,展现出扎实而全面的综合实力。

通过通专融合的训练策略,Intern-S1-Pro不仅补齐了传统前沿模型在专业推理上的短板,还实现了多模态与文本通用能力的均衡发展,真正将通用能力与专业科学能力的协同演进落到实处,为科研场景下复杂问题的理解、推理与应用提供了可靠支撑。

在智能体能力方面,Intern-S1-Pro实现了从“静态任务规划”到“动态环境交互”的跨越式进阶。在以动态环境与复杂交互为核心的Tau-2评测中达到了国际一流水平,为赋能复杂科学智能体打下了坚实基础。

03.

筑牢“算力-算法”一体化基座

在规模、性能提升的同时,Intern-S1-Pro构建了原创的“算力-算法”一体化基座。模型从架构设计之初,便与昇腾计算生态确立联合研发路线,实现了从最底层的算子、编译优化到上层的训练、推理框架的深度全栈适配。

研发团队攻克了大规模训练中精度对齐、超长序列强化学习稳定性、硬件性能极致释放等一系列核心技术难题,基于XTuner V1训练框架的精细优化与LMDeploy推理引擎的高效部署,结合先进的内存管理与并行策略,确保了万亿参数模型训练的高效与稳定。通过创新的全异步强化学习框架等技术的应用,大幅提升了训练效率,降低了研发成本与门槛,此外,Intern-S1-Pro还与沐曦联合研发利用模型加速算子适配,为开放共享、面向未来的AGI4S基础设施奠定了坚实基础。

04.

高质量开源赋能创新生态

自2023年书生大模型首次发布以来,上海AI实验室已逐步构建起丰富的书生大模型家族,包括科学多模态模型Intern-S1、大语言模型书生·浦语InternLM、多模态模型书生·万象InternVL、强推理模型书生·思客InternThinker等。同时首创并开源了面向大模型研发与应用的全链路开源工具体系,覆盖数据处理、预训练、微调、部署、评测与应用等关键环节,包含训练框架XTuner、部署推理框架LMDeploy、评测框架OpenCompass、高效文档解析工具MinerU,以及思索式AI搜索应用MindSearch等在内的核心工具已全面开源,大部分也都同步发布在wisemodel开源社区,形成覆盖数十万开发者参与的活跃开源社区。

自发布以来,Intern-S1多次登顶HuggingFace全球多模态榜单,累计下载超41万次,并获得近200家科研机构和企业的合作申请。其卓越的跨模态科学理解能力不仅为科研提供了高效工具,也通过开源降低了全球科研团队迈入AGI for Science的门槛。未来,在研究范式创新及模型能力提升的基础上,上海AI实验室将推进Intern-S1及其全链条工具体系持续开源,支持免费商用,同时提供线上开放服务,与全球合作伙伴共建更加开放、高效的科学AI生态。

案例展示:

----- END -----


wisemodel相关:

系列模型:


关于wisemodel更多


1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真相大白!疑微博之夜换位置女子正面曝光,和杨幂助理多细节对上

真相大白!疑微博之夜换位置女子正面曝光,和杨幂助理多细节对上

古希腊掌管月桂的神
2026-02-08 19:53:57
震惊!网传扶着桥上灯杆的僧人还是跳下去了,事件真相浮出水面…

震惊!网传扶着桥上灯杆的僧人还是跳下去了,事件真相浮出水面…

火山诗话
2026-02-07 15:03:47
冬奥羽绒服哪家强?中国穿李宁、美国拉夫劳伦、加拿大Lululemon

冬奥羽绒服哪家强?中国穿李宁、美国拉夫劳伦、加拿大Lululemon

商务范
2026-02-07 15:47:10
25名女子在香港卖淫:每次时长不限,价格曝光,多张私密画面流出

25名女子在香港卖淫:每次时长不限,价格曝光,多张私密画面流出

博士观察
2026-02-07 18:06:23
胡静带老公回楚雄吃杀猪宴,朱兆祥用大碗喝酒真豪放,像本地人!

胡静带老公回楚雄吃杀猪宴,朱兆祥用大碗喝酒真豪放,像本地人!

疯说时尚
2026-02-08 10:39:58
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
英国48家集团主席:“到中国去,拥抱中国!”

英国48家集团主席:“到中国去,拥抱中国!”

环球网资讯
2026-02-07 16:41:41
河南美女老师被抓,卧室发现一本日记,里面所写内容令人崩溃

河南美女老师被抓,卧室发现一本日记,里面所写内容令人崩溃

可儿故事汇
2024-10-19 18:41:40
这是傅作义与李宗仁的真实容貌,不是演员扮演

这是傅作义与李宗仁的真实容貌,不是演员扮演

阿废冷眼观察所
2026-02-08 16:38:41
新华社快讯:出口民调显示日本执政联盟将获得众议院过半议席

新华社快讯:出口民调显示日本执政联盟将获得众议院过半议席

新华社
2026-02-08 19:03:04
邓超晒水下全家福,调侃忘记结婚纪念日礼物,孙俪坏笑回应

邓超晒水下全家福,调侃忘记结婚纪念日礼物,孙俪坏笑回应

草莓解说体育
2026-02-08 18:20:26
原来我们熟悉的许多明星用的都是艺名,谁的本名最令你感到意外?

原来我们熟悉的许多明星用的都是艺名,谁的本名最令你感到意外?

上官晚安
2026-02-08 01:36:41
英国各大啤酒品牌纷纷将酒精度降至3.4%

英国各大啤酒品牌纷纷将酒精度降至3.4%

啤酒日报
2026-02-06 18:36:14
欧尔班:乌克兰是我们的敌人

欧尔班:乌克兰是我们的敌人

环球时报国际
2026-02-08 13:13:12
2-0通杀英超BIG5!卡里克三招激活崩溃曼联,把毒药变解药!

2-0通杀英超BIG5!卡里克三招激活崩溃曼联,把毒药变解药!

落夜足球
2026-02-08 01:41:35
上海这晚,57岁周涛秒了30岁李雪琴,不愧是央视严选的国泰民安脸

上海这晚,57岁周涛秒了30岁李雪琴,不愧是央视严选的国泰民安脸

大铁猫娱乐
2026-02-08 00:10:03
约基奇轰20+14+17仍无缘今日最佳!抱歉,你碰到创纪录的卡斯尔了

约基奇轰20+14+17仍无缘今日最佳!抱歉,你碰到创纪录的卡斯尔了

世界体育圈
2026-02-08 13:34:05
大奖赛收官奖金排名:赵心童夺冠179万!火箭14万第9,丁俊晖9万

大奖赛收官奖金排名:赵心童夺冠179万!火箭14万第9,丁俊晖9万

小火箭爱体育
2026-02-08 21:35:47
这个一妻多夫制的民族,晚上怎么过?女人直言:简直就是受罪

这个一妻多夫制的民族,晚上怎么过?女人直言:简直就是受罪

晨光苏醒a
2026-02-05 19:17:21
白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

离离言几许
2026-02-06 22:01:56
2026-02-08 22:16:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
455文章数 14关注度
往期回顾 全部

科技要闻

为实现雄心勃勃的计划,特斯拉开始招人

头条要闻

美国"夺岛"渗入格陵兰居民生活 每天有多国军人抵达

头条要闻

美国"夺岛"渗入格陵兰居民生活 每天有多国军人抵达

体育要闻

铜牌与苏翊鸣的这四年,他说:我对得起自己

娱乐要闻

金晨被罚1500后首露面,表情沉重心事重重

财经要闻

宽基ETF开年大赎回,什么信号?

汽车要闻

VLA司机大模型优化 理想汽车OTA8.3版本更新

态度原创

房产
时尚
本地
公开课
军事航空

房产要闻

新春三亚置业,看过这个热盘再说!

伊姐周六热推:电视剧《成何体统》;电视剧《唐宫奇案》......

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

捐钱造航母的男孩登上军舰

无障碍浏览 进入关怀版