网易首页 > 网易号 > 正文 申请入驻

九天大模型大变身:性能狂飙35%!还能一键P大象

0
分享至

新智元报道

编辑:KingHZ 桃子

【新智元导读】九天基础大模型3.0震撼发布!在2025世界人工智能大会上,九天基础大模型端到端技术全面升级,性能飙升35%,智能体调用效率提升21%,15T token预训练,还是全国产!

7月26日,在2025世界人工智能大会期间,中国移动焕新发布「九天」基础大模型3.0。

本次发布的「九天」基础大模型3.0,重点聚焦模型的端到端技术升级以及生成可控性能力的增强,进一步强化九天大模型「高安全、高可控、全国产、全行业」的独特优势。



端到端升级,九天众擎性能大跃升

九天众擎语言大模型1.0于2023年10月发布,实现了大模型数据构建、预训练、微调、推理等全链路核心技术自主研发,是首个通过国家网信办双备案的央企大模型。

九天众擎语言大模型2.0于2024年7月发布,创新提出基于稀疏专家混合语言架构,模型参数及训练数据均有飞跃性提升,预训练阶段采用了5万亿Token数据,此外,还引入了10%的行业知识数据。

本次发布的语言大模型3.0在架构、数据、后训练、算力适配等方面实现了升级和技术创新。

架构方面,突破性采用业界领先的MoE(Mixture of Experts)架构,通过并行优化、混精计算优化、权重去冗余优化、构建自动故障恢复程序、框架快速编译与编译缓存、全局集合通信域异步创建及算子通信预建链等技术创新,解决了大模型解决算法精度溢出、非确定性计算误差、检查点存储慢、稀疏模型训练效率低下等问题。

数据方面,预训练数据总规模扩增到15T token,采用了多阶段配比方式:在第一阶段学习海量知识,第二阶段用高质量数据重点提升数学推理等各种专项能力,第三阶段(退火阶段)用长文数据和更高质量数据进行能力上的进一步爬坡。

在高质量数据方面,对数学、逻辑推理、代码、专业知识等重点领域进行了大幅增强,在数据上实现了简洁回答与长思维链深度思考的有机结合。

此外,还构建了覆盖全流程的数据治理体系技术架构,涵盖多源异构语料采集、深度清洗与标注等关键环节,还集成了敏感度检测、动态资源调度等核心能力,能够实现多语言、多文化、多地域表达的高质量覆盖,特别是在复杂语境与稀缺资源条件下具备显著优势。

后训练方面,在数据筛选阶段,核心创新在于构建了包含113域×53能力的「二维分级」数据体系,并系统性应用了基于「质量/难度/多样性/必要性」的四维筛选准则;

在数据合成阶段,创新性地提出层级原则体系, 实现从安全到高级文风再到模型个性的多维度精准指导,同时设计了数据驱动原则归纳方法及动态应用机制,从高质量数据中自动提炼隐形规则,助力九天模型从机械式检索进化为能输出商业洞察与情感共鸣的智能助手;

在强化学习阶段, 设计了一种多阶段的强化学习训练方法,创新性地结合了动态温度调节、难度自适应的数据更新机制以及上下文窗口逐步扩展策略, 实现了在长期训练过程中的稳定性保障与模型能力的持续提升。

算力适配方面,九天众擎语言大模型3.0实现了在算子、框架、模型三个层面的全栈国产适配,实现了与11家芯片厂商17款国产AI芯片的适配,在研发期间共解决了200+个芯片硬件、集群、算子、算法框架中的缺陷,完成60项算子和训练算法方面的优化。

通过多维度的端到端技术升级,模型的复杂推理能力较上一代提升35%,智能体调用效率提升21%,实现了性能的跨越式进步。

在IFEval评测中,「九天」以88.61分超越其他模型,在MMLU-Pro测评中,以71.41分超越Qwen3,在ArenaHard V0.1测评中,以91.4分超越DeepSeek V3。

性能跃升的同时,九天众擎语言大模型以「高可控智能体」为核心,构建了覆盖知识问答、角色服务、流程控制的全链路解决方案。在知识问答层面,具有低幻觉文档问答能力,通过深度语义解析精准捕捉用户意图,依托真实文档实现有据回复,确保信息生成的真实性与可靠性。

角色扮演服务场景中,模型聚焦沉浸式角色演绎,深度解析角色背景信息与SOP服务流程,基于深度推理能力模拟角色思考逻辑,显著提升客户交互的真实感与专业度。

在业务流程控制环节,九天众擎语言大模型支持自然语言、伪代码、Mermaid等多种方式描述业务规范流程,严格遵守既定工作流程与API接口协作规则,灵活应对多嵌套、多分支的复杂任务,有效规避「规划幻觉」风险,保障业务流程执行的确定性与可控性。

基于最新的语言大模型,中国移动此次也推出多个专项大模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持Python、Java、JS、TS、Go、C++等10+种主流编程语言。

性能方面,在LivecodeBench v5、BFCL V3等代码生成榜单成绩超越Qwen3及DeepSeek V3。

九天代码大模型可快速实现HTML页面设计:

九天数学大模型,在短思考、长思考模式均达到业界SOTA水平,在MATH500及AIME 2024测评任务中指标超越Qwen3。

九天大模型数学推理方面表现出色,能够准确理解数学问题的核心逻辑,并运用多种方法进行推理和验证,精准地给出答案。

本题推导了Shor算法进行质因数分解时,量子傅里叶变换后的量子态坍缩概率分布公式,模型基于周期性态和量子傅里叶变换的数学性质计算测量结果的概率



高可控视觉生成,九天善智多模态能力焕新

九天善智多模态大模型全面提升生成可控性,基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新,同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力,联合图文交织数据训练,实现既能生成高质量的图像视频,又能进行多轮对话式高可控精确编辑操作,显著提升了视觉生成的灵活便利性。

在图片生成功能方面,可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。如「生成一张公交站牌,站牌上写着『5G』的图片」。

将5G替换为6G

站牌旁边停着一辆公交车

旁边还有一辆摩托车

改成涂鸦风格

图片动起来

在视频生成功能方面,构建统一可控生成体系,视频生成可控性进一步增强,支持基于个体轨迹控制的视频生成,视频续写,基于运镜控制的视频生成以及视频编辑能力。

针对基于个体轨迹控制的视频生成,提出层次化运动建模与动态特征对齐技术,突破长程依赖建模难题。

创新性地利用运动向量解耦与三模态协同控制技术,实现支持亚像素级路径和适配多曲率运动轨迹的视频轨迹控制能力。

基于运镜控制的视频生成技术,利用语义信息解耦和时序条件注入,并通过引入相机姿态信息,模拟真实物理世界成像规律,实现对生成视频运镜的精准控制。

视频编辑能力创新性引入自适应编辑模块和结构化噪声设计,有效提升用户指令跟随能力,保证编辑前后运动以及非编辑区域的视觉一致性。

视频编辑-删除操作

视频编辑-替换操作

多模态大模型在图理解和视频理解方面的性能表现也全面提升。图理解方面,采用了token-mixing策略与视觉重采样方案,巧妙地平衡了全局感知和细粒度感知能力,使得模型在处理更高分辨率的输入图像时,依然能保持出色的性能表现,进而实现了综合能力的显著提升。

在MMStar、HallusionBench和OCRBench等图理解任务中,九天模型分别获得了82.2、64.3和94.9的高分,OpenCompass综合评分79.5分,领先其他大部分模型。

视频理解方面,九天模型设计金字塔型记忆库结构和多层渐进式的视觉token融合方案,兼顾视频流中的时间和空间信息,提升模型对于长时视觉信号的理解能力。

在Videomme任务中表现优秀,超越Qwen2-VL和GPT-4o,在MVbench任务领先其余模型。

8月6日开始,九天将开展一系列技术直播,重点解析九天基础大模型、开源模型及数据集,锁定「九天人工智能」视频号,获取最新技术干货。

附录

九天开源模型和评测体系下载链接

1. 数学大模型:JT-Math-8B 系列模型

焕新社区地址(下载方式见文末):

JT-Math-8B-Instruct:

https://aihuanxin.cn/#/model?path=/model/detail/1463

JT-Math-8B-Thinking:

https://aihuanxin.cn/#/model?path=/model/detail/1464

JT-Math-8B-Base:

https://aihuanxin.cn/#/model?path=/model/detail/1459

Huggingface地址:

https://huggingface.co/JT-LM/JT-Math-8B-Base

https://huggingface.co/JT-LM/JT-Math-8B-Instruct

https://huggingface.co/JT-LM/JT-Math-8B-Thinking

ModelScope地址:

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Instruct

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Base

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Thinking

github地址:

https://github.com/JT-LM/JT-Math-8B

gitee地址:

https://gitee.com/CMCC-jiutian/jt-math-8b.git

2. 代码大模型:JT-Coder-8B 系列模型

焕新社区地址(下载方式见文末):

JT-Coder-8B-Instruct:

https://aihuanxin.cn/#/model?path=/model/detail/1458

JT-Coder-8B-Base:

https://aihuanxin.cn/#/model?path=/model/detail/1466

Huggingface地址:

https://huggingface.co/JT-LM/JT-Coder-8B-Base

https://huggingface.co/JT-LM/JT-Coder-8B-Instruct

ModelScope地址:

https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Base

https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Instruct

焕新社区开源获取方式:

进入焕新社区(aihuanxin.cn),进入模型库/数据集,选择组织【九天人工智能】,快速获取九天最新开源内容。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
长江:你“禁渔”让我歇十年,我把活化石从地底下刨出来送给你

长江:你“禁渔”让我歇十年,我把活化石从地底下刨出来送给你

启迪你的思维
2026-07-03 04:38:23
乌克兰向波兰提出关系正常化方案

乌克兰向波兰提出关系正常化方案

参考消息
2026-07-04 20:47:03
印媒高调宣称,印度空调制造商将帮欧洲降温,抢夺中国厂商的订单

印媒高调宣称,印度空调制造商将帮欧洲降温,抢夺中国厂商的订单

王新喜
2026-07-02 15:08:27
女人第一次“越界”,通常会有这些顾虑,很真实

女人第一次“越界”,通常会有这些顾虑,很真实

叶飞飞情感屋
2026-07-04 20:43:42
美国盯上中国电路板,印对华出口却暴增40倍!印度不会一直拧螺丝

美国盯上中国电路板,印对华出口却暴增40倍!印度不会一直拧螺丝

王新喜
2026-07-04 15:52:14
越来越多的人患癌症!医生含泪苦劝:冰箱久置的6物,别再吃了!

越来越多的人患癌症!医生含泪苦劝:冰箱久置的6物,别再吃了!

路医生健康科普
2026-06-15 17:20:36
王毅成大明星了?访问丹麦途中,丹麦网友惊叹:中国来的外长好帅

王毅成大明星了?访问丹麦途中,丹麦网友惊叹:中国来的外长好帅

笙歌君独幽a
2026-07-05 00:07:07
人民日报、新华社、中央广播电视总台集中报道:北京人工智能赋能科学研究实施方案启动

人民日报、新华社、中央广播电视总台集中报道:北京人工智能赋能科学研究实施方案启动

侃故事的阿庆
2026-07-04 00:20:18
“挂了快一年,从200多万降到160万,心一横,卖了。”房东割肉离场,杭州“老破小”价格回到十年前

“挂了快一年,从200多万降到160万,心一横,卖了。”房东割肉离场,杭州“老破小”价格回到十年前

都市快报橙柿互动
2026-07-04 09:57:12
说实话!娜然如果真的能嫁入霍家,尴尬的不是章子怡,而是霍家了

说实话!娜然如果真的能嫁入霍家,尴尬的不是章子怡,而是霍家了

TVB的四小花
2026-07-03 10:32:10
普京刚穿军装宣布大捷,200架无人机就打到莫斯科

普京刚穿军装宣布大捷,200架无人机就打到莫斯科

浪子的烟火人间
2026-07-05 02:05:07
测量319位中国女性外阴,他们发表全球首例研究

测量319位中国女性外阴,他们发表全球首例研究

医学界妇产科频道
2026-06-27 19:51:42
广东婚宴起冲突,堂姐强占主桌逼长辈坐角落,新娘劝阻还摔碗离席

广东婚宴起冲突,堂姐强占主桌逼长辈坐角落,新娘劝阻还摔碗离席

一盅情怀
2026-07-03 20:02:34
60年代,冯巩在幼儿园的照片,人家这长相,小时候都不怕丢

60年代,冯巩在幼儿园的照片,人家这长相,小时候都不怕丢

喜文多见01
2026-05-10 07:00:29
谁干的?俄大使馆遭袭,美英法德乌失声,俄方打击名单正式公布

谁干的?俄大使馆遭袭,美英法德乌失声,俄方打击名单正式公布

带你领略快乐真谛
2026-07-04 22:42:17
以为霍家要栽在新儿媳绯闻上,谁也没料到,霍启山藏这么硬的底牌

以为霍家要栽在新儿媳绯闻上,谁也没料到,霍启山藏这么硬的底牌

孤傲何妨初
2026-07-05 02:41:24
伊朗情报部:捣毁4个与美以有关的“恐怖和极端组织”据点

伊朗情报部:捣毁4个与美以有关的“恐怖和极端组织”据点

观察者网
2026-07-05 06:48:08
名媛不帮郭富城夫妻P图被骂!方媛又肿又僵,郭富城是花甲老爷爷

名媛不帮郭富城夫妻P图被骂!方媛又肿又僵,郭富城是花甲老爷爷

草莓解说体育
2026-07-03 15:28:20
保剑锋撤诉!承认和黄慧颐结过婚,私下已达成和解,原因特别现实

保剑锋撤诉!承认和黄慧颐结过婚,私下已达成和解,原因特别现实

小椰的奶奶
2026-07-04 05:10:09
彻底谈崩!哈里梅根团队放新消息,查尔斯态度强硬,祖孙无缘相见

彻底谈崩!哈里梅根团队放新消息,查尔斯态度强硬,祖孙无缘相见

草莓解说体育
2026-07-05 03:08:25
2026-07-05 07:19:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15607文章数 66947关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

游戏
家居
房产
本地
数码

韩版“全境封锁”PC配置降低 内存改为32GB起步

家居要闻

传奇筑 日常诗

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

本地新闻

国内足球之旅?这座小城给你高分答案

数码要闻

苏姿丰签名同款!极摩客EVO-X3 AI工作站全球开卖:国行版21699元起

无障碍浏览 进入关怀版