网易首页 > 网易号 > 正文 申请入驻

上海AI独角兽MiniMax发布全模态“全家桶”:中国AI从跟跑到领跑的技术突围

0
分享至

来源:环球网

在人工智能技术日新月异的当下,上海AI独角兽MiniMax稀宇极智以其独特的技术路径和商业策略,在10月的最后一周掀起了一场AI技术的”全家桶”发布热潮。继开源文本大模型M2震动全球AI圈,接连发布视频模型Hailuo 2.3、语音模型Speech 2.6和音乐模型Music 2.0,标志着中国AI企业在全模态技术领域的全面突破。

M2领衔:中国开源模型首次跻身全球前五

10月27日,新一代文本大模型MiniMax-M2正式发布和开源,这款仅有10B激活参数(总参230B)的轻量级模型在全球权威测评榜单Artificial Analysis (AA)上创造了历史性突破——总分冲入全球前五、开源第一,成功跻身全球文本模型第一梯队。

这一成绩的意义非同寻常。长期以来,全球大模型的”S级”梯队几乎被硅谷巨头们垄断,而M2的出现首次为这一梯队注入了强劲的中国开源力量。更令人瞩目的是M2的颠覆性定价策略。该模型综合成本低至约0.53美元/百万Tokens,不及Claude 4.5 Sonnet的8%,推理速度是其近两倍。这种”高智能,更实惠”的理念正在从根本上改写AI领域的”算力游戏”规则。

“M2专为编码与智能体任务深度优化,完美契合了新兴多智能体工作流对高效协同与快速响应的需求。”MiniMax相关负责人表示。在模型性能、推理速度、推理成本的不可能三角中,MiniMax几乎做到了最佳优化。而这些能力对于企业内部的自动化支持、研发和数据分析等场景部署越来越重要。

值得注意的是,就在M2的发布前不久,Meta在超过40万GPU小时的大规模实验中,正式采用了MiniMax在2025年6月原发技术报告中的CISPO损失函数和FP32 Head技术,将它们整合进了Meta的ScaleRL核心配方中。这是中国AI技术首次被硅谷AI霸主深度整合并大规模验证,标志着中国在强化学习算法这一AI核心领域的全球领先地位得到了国际权威的正式确认。

Hailuo 2.3:视频生成技术的新标杆

紧随M2的发布,10月28日最新视频生成模型海螺2.3(Hailuo 2.3)正式发布。这款在Hailuo 02模型基础上实现全面技术升级的新版本,在动态表现力、风格化呈现以及人物表演细腻度方面取得了显著突破。

海螺2.3的技术亮点主要体现在三个维度:首先是强大的动态表现力,模型能够精准实现复杂的人体动作序列,无论是大幅度的动态运镜还是细微的肢体变化,都能够呈现出近乎实拍的视觉效果;其次是风格化创作能力的显著提升,对动漫、插画类风格的支持效果明显改善,同时对水墨、游戏CG等特殊画风的表现更加出色;最后是人物表演的自然度大幅提升,对真人面部表演和微表情变化的表现更加细腻自然。

在成本控制方面,海螺2.3同样表现突出。新版本模型再次刷新了全球视频模型效果成本纪录,在提升性能表现的同时保持了Hailuo 02的原有定价水平,实现了”加量不加价”的承诺。同时推出的海螺2.3 Fast版本,在保证画质和表现力的基础上大幅提升了生成速度,并采用了更低的定价策略,批量创作成本最高可降低50%。

Speech 2.6:重新定义Voice Agent新基建

在语音技术领域,MiniMax发布的Speech 2.6模型同样引人注目。该模型专门针对Voice Agent场景进行了深度优化,将首包响应时间压到了250毫秒,达到了语音赛道的绝对头部水平。

“Voice Agent可以理解为’语音交互代理人’,它是连接用户语音指令与后端服务的核心桥梁。”MiniMax相关负责人解释道。与传统语音指令识别不同,Voice Agent不只是简单将语音转成文字,而是具备完整的交互能力,几乎所有需要”用说话代替打字”的场景,都依赖Voice Agent来承接需求、理解意图并给出反馈。

Speech 2.6的升级亮点包括:超低延时响应、专业格式无障碍识别和更高自然度。新增的”Fluent Lora”功能能够将”磕磕巴巴”的原始录音复刻出流畅自然的声音,这对需要大量用户自定义音色的场景,如有声书、个性化语音助手非常实用。

Music 2.0:让音乐创作属于每一个人

在音乐生成领域,MiniMax Music 2.0模型实现了真正的跃升。该模型不仅能够精准捕捉与还原人声的细腻情绪和器乐的动态张力,更像一位”会唱歌的制作人”,懂节奏,也懂情绪。

Music 2.0在人声表现方面实现了重大突破,音色无限接近真实人声,能够驾驭多种唱法和情感风格,支持男女对唱、阿卡贝拉等风格。模型还支持对人声音色的精准控制,可以在保持核心音色的基础上,让同一声音切换不同唱法,实现”一声千变”。

在器乐控制方面,Music 2.0继承了上一代模型结构完整的优点,能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲,单首时长可达5分钟。新模型生成的旋律更容易记忆、能够迅速抓住耳朵,在不同风格表达中可遵循精准的指令控制,实现层次丰富、律动自然的编曲。

中国AI的”算法自信”与全球影响力

MiniMax此次”AI全家桶”发布的意义超越了技术本身,它折射出中国AI在全球科技版图中的角色变迁。从Meta对MiniMax底层算法的”致敬”,到今天MiniMax全模态模型以顶级性能和颠覆性成本向全球开源,我们看到了一条清晰的轨迹:中国AI正在完成从”中国制造”(应用模仿)到”中国创造”(算法原创)的战略转变。

在国家战略层面,我国强调大模型技术必须”自主可控”,防止被境外或不可靠技术牵制。强大的基础大模型是推动AI与实体经济深度融合的关键。MiniMax的全模态”全家桶”更像是一份”中国方案”,用性能比肩顶尖水平、成本实现普惠、算法勇于原创的独特AI发展路径,向世界提交答卷。

可以看到,中国AI正以一种前所未有的自信姿态,从全球AI竞赛的”跟跑者”,加速变为关键赛道的”领跑者”。随着海螺2.3、Speech 2.6、Music 2.0的正式发布,AI视频、语音、音乐生成技术将迎来新的发展阶段,为数字内容创作产业注入新的活力。

MiniMax相关负责人表示:“AI技术正在改变越来越多人的工作和创作方式,我们希望成为创作者的全能助手和创新先锋,让每一个灵感都能超越形式的限制,生长成各行各业的真实生产力。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
东航昨夜一北京飞上海航班,落地后舱内现火情,官方通报:系旅客手机掉落座椅缝隙受挤压冒烟

东航昨夜一北京飞上海航班,落地后舱内现火情,官方通报:系旅客手机掉落座椅缝隙受挤压冒烟

纵相新闻
2026-03-26 01:52:05
20分惨败!CBA焦点1战,山东大破新疆男篮,巩晓彬苦笑:都输麻了

20分惨败!CBA焦点1战,山东大破新疆男篮,巩晓彬苦笑:都输麻了

话体坛
2026-03-25 22:16:29
中国第三任国家主席,墓碑上不留姓名,碑文仅有二十四个字!

中国第三任国家主席,墓碑上不留姓名,碑文仅有二十四个字!

年代回忆
2026-03-24 20:23:00
孤胆英雄:NBA历史上那些“单核”带队的终极神话

孤胆英雄:NBA历史上那些“单核”带队的终极神话

茅塞盾开本尊
2026-03-26 13:05:20
女儿高考当天,我撞见婆婆往她汤里下药,我偷偷换给了高考的侄子

女儿高考当天,我撞见婆婆往她汤里下药,我偷偷换给了高考的侄子

鱼语昱雨轩
2026-03-25 14:03:47
泰国U23主帅:中国队是支很强劲的队伍,这场比赛对我们有益

泰国U23主帅:中国队是支很强劲的队伍,这场比赛对我们有益

懂球帝
2026-03-26 10:30:13
太突然!董事长汤建,因心梗意外去世

太突然!董事长汤建,因心梗意外去世

每日经济新闻
2026-03-25 18:21:26
余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

快科技
2026-03-24 15:22:21
连续三天,重庆市委书记袁家军围绕这件事调研

连续三天,重庆市委书记袁家军围绕这件事调研

中国乡村振兴
2026-03-26 10:02:48
杜锋发布会发飙,反问记者,球迷为陈家政担心:你可以离开球队了

杜锋发布会发飙,反问记者,球迷为陈家政担心:你可以离开球队了

南海浪花
2026-03-26 00:26:05
曝马英九完全不见他!萧旭岑:很多事长辈忘了、质疑能怎么办?

曝马英九完全不见他!萧旭岑:很多事长辈忘了、质疑能怎么办?

新时光点滴
2026-03-25 11:32:56
果然越不体面小生意往往闷声发大财!网友:一年不低于50万

果然越不体面小生意往往闷声发大财!网友:一年不低于50万

夜深爱杂谈
2026-03-23 20:05:31
杨瀚森9投9中+单手隔扣 20分9板5助触底反弹

杨瀚森9投9中+单手隔扣 20分9板5助触底反弹

体坛周报
2026-03-26 11:17:12
11场10球!皇马新帅有点神:伯纳乌迎回熊皇!贝林厄姆:逆境重生

11场10球!皇马新帅有点神:伯纳乌迎回熊皇!贝林厄姆:逆境重生

万花筒体育球球
2026-03-25 17:39:15
向“新” 向“智” 向“绿”——重大工程项目一线观察

向“新” 向“智” 向“绿”——重大工程项目一线观察

新华社
2026-03-25 16:08:21
我爱上41岁女人,她开口:玩玩可以但不结婚,得知真相我瘫坐在地

我爱上41岁女人,她开口:玩玩可以但不结婚,得知真相我瘫坐在地

小月故事
2026-03-19 17:08:37
张雪峰生前忠告:普通学生不要碰的20个专业,大家千万别忘记!

张雪峰生前忠告:普通学生不要碰的20个专业,大家千万别忘记!

教育导向分享
2026-03-25 22:28:37
73年工人运动现分歧,巴枯宁质问马克思:无产阶级掌权后将统治谁

73年工人运动现分歧,巴枯宁质问马克思:无产阶级掌权后将统治谁

磊子讲史
2026-03-25 12:21:48
闯祸的最高境界是什么?看网友讲述,这是正常人能做出的事情吗?

闯祸的最高境界是什么?看网友讲述,这是正常人能做出的事情吗?

侃神评故事
2026-03-21 19:15:03
末代港督彭定康夫妇,带3个漂亮女儿回英国,29年过去今过得咋样

末代港督彭定康夫妇,带3个漂亮女儿回英国,29年过去今过得咋样

揽星河的笔记
2026-03-26 00:26:09
2026-03-26 13:28:49
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1347601文章数 2710881关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
教育
手机
数码
军事航空

转头就晕的耳石症,能开车上班吗?

教育要闻

太管用了!高考俄语二轮复习听力模块得分要点!

手机要闻

华为全面回归官宣!产品全覆盖、麒麟全搭载,国产手机重回巅峰

数码要闻

海盗船MAKR PRO 75霍尔效应磁轴键盘国行上市,1999元

军事要闻

伊朗重申非交战国家船只可安全通过霍尔木兹海峡

无障碍浏览 进入关怀版