网易首页 > 网易号 > 正文 申请入驻

九天大模型大变身:性能狂飙35%!还能一键P大象

0
分享至


新智元报道

编辑:KingHZ 桃子

【新智元导读】九天基础大模型3.0震撼发布!在2025世界人工智能大会上,九天基础大模型端到端技术全面升级,性能飙升35%,智能体调用效率提升21%,15T token预训练,还是全国产!

7月26日,在2025世界人工智能大会期间,中国移动焕新发布「九天」基础大模型3.0。

本次发布的「九天」基础大模型3.0,重点聚焦模型的端到端技术升级以及生成可控性能力的增强,进一步强化九天大模型「高安全、高可控、全国产、全行业」的独特优势。



端到端升级,九天众擎性能大跃升

九天众擎语言大模型1.0于2023年10月发布,实现了大模型数据构建、预训练、微调、推理等全链路核心技术自主研发,是首个通过国家网信办双备案的央企大模型。

九天众擎语言大模型2.0于2024年7月发布,创新提出基于稀疏专家混合语言架构,模型参数及训练数据均有飞跃性提升,预训练阶段采用了5万亿Token数据,此外,还引入了10%的行业知识数据。

本次发布的语言大模型3.0在架构、数据、后训练、算力适配等方面实现了升级和技术创新。

架构方面,突破性采用业界领先的MoE(Mixture of Experts)架构,通过并行优化、混精计算优化、权重去冗余优化、构建自动故障恢复程序、框架快速编译与编译缓存、全局集合通信域异步创建及算子通信预建链等技术创新,解决了大模型解决算法精度溢出、非确定性计算误差、检查点存储慢、稀疏模型训练效率低下等问题。

数据方面,预训练数据总规模扩增到15T token,采用了多阶段配比方式:在第一阶段学习海量知识,第二阶段用高质量数据重点提升数学推理等各种专项能力,第三阶段(退火阶段)用长文数据和更高质量数据进行能力上的进一步爬坡。

在高质量数据方面,对数学、逻辑推理、代码、专业知识等重点领域进行了大幅增强,在数据上实现了简洁回答与长思维链深度思考的有机结合。

此外,还构建了覆盖全流程的数据治理体系技术架构,涵盖多源异构语料采集、深度清洗与标注等关键环节,还集成了敏感度检测、动态资源调度等核心能力,能够实现多语言、多文化、多地域表达的高质量覆盖,特别是在复杂语境与稀缺资源条件下具备显著优势。

后训练方面,在数据筛选阶段,核心创新在于构建了包含113域×53能力的「二维分级」数据体系,并系统性应用了基于「质量/难度/多样性/必要性」的四维筛选准则;

在数据合成阶段,创新性地提出层级原则体系, 实现从安全到高级文风再到模型个性的多维度精准指导,同时设计了数据驱动原则归纳方法及动态应用机制,从高质量数据中自动提炼隐形规则,助力九天模型从机械式检索进化为能输出商业洞察与情感共鸣的智能助手;

在强化学习阶段, 设计了一种多阶段的强化学习训练方法,创新性地结合了动态温度调节、难度自适应的数据更新机制以及上下文窗口逐步扩展策略, 实现了在长期训练过程中的稳定性保障与模型能力的持续提升。

算力适配方面,九天众擎语言大模型3.0实现了在算子、框架、模型三个层面的全栈国产适配,实现了与11家芯片厂商17款国产AI芯片的适配,在研发期间共解决了200+个芯片硬件、集群、算子、算法框架中的缺陷,完成60项算子和训练算法方面的优化。

通过多维度的端到端技术升级,模型的复杂推理能力较上一代提升35%,智能体调用效率提升21%,实现了性能的跨越式进步。

在IFEval评测中,「九天」以88.61分超越其他模型,在MMLU-Pro测评中,以71.41分超越Qwen3,在ArenaHard V0.1测评中,以91.4分超越DeepSeek V3。

性能跃升的同时,九天众擎语言大模型以「高可控智能体」为核心,构建了覆盖知识问答、角色服务、流程控制的全链路解决方案。在知识问答层面,具有低幻觉文档问答能力,通过深度语义解析精准捕捉用户意图,依托真实文档实现有据回复,确保信息生成的真实性与可靠性。

角色扮演服务场景中,模型聚焦沉浸式角色演绎,深度解析角色背景信息与SOP服务流程,基于深度推理能力模拟角色思考逻辑,显著提升客户交互的真实感与专业度。

在业务流程控制环节,九天众擎语言大模型支持自然语言、伪代码、Mermaid等多种方式描述业务规范流程,严格遵守既定工作流程与API接口协作规则,灵活应对多嵌套、多分支的复杂任务,有效规避「规划幻觉」风险,保障业务流程执行的确定性与可控性。

基于最新的语言大模型,中国移动此次也推出多个专项大模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持Python、Java、JS、TS、Go、C++等10+种主流编程语言。

性能方面,在LivecodeBench v5、BFCL V3等代码生成榜单成绩超越Qwen3及DeepSeek V3。


九天代码大模型可快速实现HTML页面设计:




九天数学大模型,在短思考、长思考模式均达到业界SOTA水平,在MATH500及AIME 2024测评任务中指标超越Qwen3。


九天大模型数学推理方面表现出色,能够准确理解数学问题的核心逻辑,并运用多种方法进行推理和验证,精准地给出答案。


本题推导了Shor算法进行质因数分解时,量子傅里叶变换后的量子态坍缩概率分布公式,模型基于周期性态和量子傅里叶变换的数学性质计算测量结果的概率



高可控视觉生成,九天善智多模态能力焕新

九天善智多模态大模型全面提升生成可控性,基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新,同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力,联合图文交织数据训练,实现既能生成高质量的图像视频,又能进行多轮对话式高可控精确编辑操作,显著提升了视觉生成的灵活便利性。

在图片生成功能方面,可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。如「生成一张公交站牌,站牌上写着『5G』的图片」。


将5G替换为6G


站牌旁边停着一辆公交车


旁边还有一辆摩托车


改成涂鸦风格


图片动起来


在视频生成功能方面,构建统一可控生成体系,视频生成可控性进一步增强,支持基于个体轨迹控制的视频生成,视频续写,基于运镜控制的视频生成以及视频编辑能力。

针对基于个体轨迹控制的视频生成,提出层次化运动建模与动态特征对齐技术,突破长程依赖建模难题。

创新性地利用运动向量解耦与三模态协同控制技术,实现支持亚像素级路径和适配多曲率运动轨迹的视频轨迹控制能力。

基于运镜控制的视频生成技术,利用语义信息解耦和时序条件注入,并通过引入相机姿态信息,模拟真实物理世界成像规律,实现对生成视频运镜的精准控制。

视频编辑能力创新性引入自适应编辑模块和结构化噪声设计,有效提升用户指令跟随能力,保证编辑前后运动以及非编辑区域的视觉一致性。

视频编辑-删除操作

视频编辑-替换操作

多模态大模型在图理解和视频理解方面的性能表现也全面提升。图理解方面,采用了token-mixing策略与视觉重采样方案,巧妙地平衡了全局感知和细粒度感知能力,使得模型在处理更高分辨率的输入图像时,依然能保持出色的性能表现,进而实现了综合能力的显著提升。

在MMStar、HallusionBench和OCRBench等图理解任务中,九天模型分别获得了82.2、64.3和94.9的高分,OpenCompass综合评分79.5分,领先其他大部分模型。



视频理解方面,九天模型设计金字塔型记忆库结构和多层渐进式的视觉token融合方案,兼顾视频流中的时间和空间信息,提升模型对于长时视觉信号的理解能力。

在Videomme任务中表现优秀,超越Qwen2-VL和GPT-4o,在MVbench任务领先其余模型。


8月6日开始,九天将开展一系列技术直播,重点解析九天基础大模型、开源模型及数据集,锁定「九天人工智能」视频号,获取最新技术干货。

附录

九天开源模型和评测体系下载链接

1. 数学大模型:JT-Math-8B 系列模型

焕新社区地址(下载方式见文末):

JT-Math-8B-Instruct:

https://aihuanxin.cn/#/model?path=/model/detail/1463

JT-Math-8B-Thinking:

https://aihuanxin.cn/#/model?path=/model/detail/1464

JT-Math-8B-Base:

https://aihuanxin.cn/#/model?path=/model/detail/1459

Huggingface地址:

https://huggingface.co/JT-LM/JT-Math-8B-Base

https://huggingface.co/JT-LM/JT-Math-8B-Instruct

https://huggingface.co/JT-LM/JT-Math-8B-Thinking

ModelScope地址:

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Instruct

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Base

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Thinking

github地址:

https://github.com/JT-LM/JT-Math-8B

gitee地址:

https://gitee.com/CMCC-jiutian/jt-math-8b.git

2. 代码大模型:JT-Coder-8B 系列模型

焕新社区地址(下载方式见文末):

JT-Coder-8B-Instruct:

https://aihuanxin.cn/#/model?path=/model/detail/1458

JT-Coder-8B-Base:

https://aihuanxin.cn/#/model?path=/model/detail/1466

Huggingface地址:

https://huggingface.co/JT-LM/JT-Coder-8B-Base

https://huggingface.co/JT-LM/JT-Coder-8B-Instruct

ModelScope地址:

https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Base

https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Instruct

焕新社区开源获取方式:

进入焕新社区(aihuanxin.cn),进入模型库/数据集,选择组织【九天人工智能】,快速获取九天最新开源内容。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
邓华缴获五箱白金龙香烟,只给毛主席递上一支,主席笑着打趣:“财不露白” 嘛!

邓华缴获五箱白金龙香烟,只给毛主席递上一支,主席笑着打趣:“财不露白” 嘛!

源溯历史
2025-12-30 20:23:13
哭倒在女记者怀中?湖人男球迷身份曝光

哭倒在女记者怀中?湖人男球迷身份曝光

天光破云来
2026-01-02 12:29:26
美国人气最高的灵媒“先知牧师”说2026:东方高大的人戴上王冠,王冠上镶嵌四块曾经失去的宝石

美国人气最高的灵媒“先知牧师”说2026:东方高大的人戴上王冠,王冠上镶嵌四块曾经失去的宝石

神奇故事
2026-01-01 21:39:12
“台独”若再看不清两岸历史大势就彻底无药可救了

“台独”若再看不清两岸历史大势就彻底无药可救了

环球时报国际
2026-01-02 15:09:34
2026年养老金继续涨!3类退休人员涨得多,2类人“一分不涨”!

2026年养老金继续涨!3类退休人员涨得多,2类人“一分不涨”!

猫叔东山再起
2026-01-03 08:40:03
浙江阿姨的养老底气:23年攥住宁沪高速,117万变521万稳享晚年

浙江阿姨的养老底气:23年攥住宁沪高速,117万变521万稳享晚年

真实人物采访
2026-01-02 09:30:07
山东公布最新行政区划代码 看看你的家乡是什么数字

山东公布最新行政区划代码 看看你的家乡是什么数字

天下泉城
2026-01-02 16:41:10
邵佳一选人太大胆了!3任主帅都不敢用的球员,如今被他召进国足

邵佳一选人太大胆了!3任主帅都不敢用的球员,如今被他召进国足

侃球熊弟
2026-01-03 00:45:03
旅客擅自拆除海关关锁,携带1553支减肥针剂入境,承认用于谋利,已被缉私部门立案处理

旅客擅自拆除海关关锁,携带1553支减肥针剂入境,承认用于谋利,已被缉私部门立案处理

环球网资讯
2026-01-02 14:02:10
中使馆提醒:中国公民暂勿前往

中使馆提醒:中国公民暂勿前往

澎湃新闻
2026-01-02 11:03:32
天赋被埋没了一辈子是啥体验?网友:学啥都快,放弃也特别快

天赋被埋没了一辈子是啥体验?网友:学啥都快,放弃也特别快

带你感受人间冷暖
2026-01-02 00:10:08
2026生育新政1月1日落地!生养住育全补贴,福利超实在

2026生育新政1月1日落地!生养住育全补贴,福利超实在

一口娱乐
2026-01-03 01:38:36
四队竞争小波特!勇士愿用库明加当筹码 两大因素评估交易价值

四队竞争小波特!勇士愿用库明加当筹码 两大因素评估交易价值

罗说NBA
2026-01-03 05:45:33
最低气温零下10.6℃,安徽局地再迎降雪

最低气温零下10.6℃,安徽局地再迎降雪

鲁中晨报
2026-01-03 09:13:07
中方公布:“星链”卫星两次危险抵近,迫使中国空间站紧急规避,严重威胁航天员生命安全;其还被电诈集团大量使用

中方公布:“星链”卫星两次危险抵近,迫使中国空间站紧急规避,严重威胁航天员生命安全;其还被电诈集团大量使用

每日经济新闻
2026-01-01 00:38:04
演都不演了,李咏美国下葬7年后,妻子哈文还是走上了姜昆的老路

演都不演了,李咏美国下葬7年后,妻子哈文还是走上了姜昆的老路

涵豆说娱
2025-12-31 17:57:41
今晚广东对阵北控,赛前杜锋一席话透露担忧,奎因和徐杰因伤缺席

今晚广东对阵北控,赛前杜锋一席话透露担忧,奎因和徐杰因伤缺席

梅亭谈
2026-01-03 10:15:52
3-0,法甲领头羊完胜图卢兹,豪取8连胜,领先巴黎圣日耳曼4分

3-0,法甲领头羊完胜图卢兹,豪取8连胜,领先巴黎圣日耳曼4分

侧身凌空斩
2026-01-03 05:45:15
日本乒协果断换人!张本美混双搭档被剔除,背后暗藏深度职业考量

日本乒协果断换人!张本美混双搭档被剔除,背后暗藏深度职业考量

体坛亦说
2026-01-03 10:28:29
李善长被处死时已年近80,每天耕地种田,朱元璋为何非要斩他满门

李善长被处死时已年近80,每天耕地种田,朱元璋为何非要斩他满门

千秋文化
2025-12-27 21:50:26
2026-01-03 11:48:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14240文章数 66418关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

美媒:中国决意在拉美继续深耕 对美国寸步不让

头条要闻

美媒:中国决意在拉美继续深耕 对美国寸步不让

体育要闻

快船似乎又行了

娱乐要闻

“国服嫂子”司晓迪,曝与多位男星私照

财经要闻

人工智能四问:投资泡沫出现了吗?

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

亲子
数码
时尚
公开课
军事航空

亲子要闻

当儿子考试考了100分,意想不到的结局

数码要闻

号称全球首款AI电竞显示器,微星预热QD-OLED旗舰MEG X

上年纪的女人别乱买衣服!有这3件单品就够了,温暖体面一冬

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

跨年夜乌军袭击"俄控区"平民 已致27死

无障碍浏览 进入关怀版