网易首页 > 网易号 > 正文 申请入驻

MiniMax五连发,上海大模型终于打上国际榜

0
分享至

当市场相信中国大模型“六小虎”的叙事已经瓦解,追逐AGI的重任交给DeepSeek之后,MiniMax似乎正在以类似DeepSeek的方式,证明中国不止一家DeepSeek。

“六小虎”已经分化,从当初在中国复制OpenAI,到有的只做应用了,有的还在走模型应用一体化,并且证明可以跻身国内的前沿模型了。

昨日,MiniMax开源了长上下文推理大模型MiniMax-M1,今日,又发布了视频生成模型Hailuo02(海螺02)。虽然稍微迟了点,但是,前者已经整体追平了R1-0528,后者一出场就拿下了图生视频排行榜的第二名,超越了谷歌的Veo3,仅次于字节跳动的Seedance 1.0。

Prompt:慢慢推进到蜡烛的特写镜头,然后蜡烛被吹灭。

就像年初DeepSeek那样,MiniMax还预告了自己的“上新”活动,将会持续整整一周。比性能重要的,是它如何实现这一性能。这两天,MiniMax介绍的最多的,就是自己还在创新。

M1引入了闪电注意力机制(Lightning Attention),以更低的算力消耗,带来了更长的推理空间,突破了transformer及其注意力机制越来越吃算力的束缚。它还引入了CISPO算法(直译为剪裁重要性采样权重策略优化),进一步优化强化学习阶段,效率优于DeepSeek早期使用的GRPO与近期字节跳动使用的DAPO。以往传统的剪裁算法,倾向于直接砍掉不常见的token,因为它有可能不大重要,但这也意味着可能失去让AI变得更聪明的机会。艾伦研究所Nathan Lambert认为这是MiniMax的创新。

最终,M1的成本下降、性能提升。作为MOE架构的推理模型,它的总参数规模4560亿,激活参数规模459亿;在512个H800 GPU上训练了3周,成本略高于50万美元。它支持100 万tokens 输入,全球最长,与Gemini-2.5-Pro齐平,是DeepSeek-R1的八倍;8万tokens 输出,仅次于o3,在软件工程、智能体工具使用以及长上下文理解等任务中的表现,超越了其他前沿开源权重模型。不过,在数学和编码竞赛中,仍然没能赢过最新的R1-0528。测评研究机构Artificial Analysis综合评估,它是仅次于刚发布的R1-0528的第二强大的开源推理模型。

MiniMax有如此取舍的现实考量。年初,该公司创始人闫俊杰称,更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。智能体正在爆发,长上下文理解正是智能体关键技术之一。

在技术报告中,M1的定位是为“下一代的大模型与智能体解决现实世界的挑战奠定坚实的基础”。

五连发的第二日,MiniMax发布视频生成模型Hailuo02,引入了更高效的NCR架构(直译为噪声感知计算重分配),让模型训练和推理效率大大提升。在成本基本不变的情况下,Hailuo02的参数规模与训练数据分别较上一代模型提升了2倍与3倍。现在,同样的投入,它生成的1080p视频的长度将是谷歌Veo3的8倍,是OpenAI的16倍。

就在本周,同为“六小虎”的月之暗面,发布了编程大模型Kimi-Dev-72B,并向社区开源了其模型权重与源代码。月之暗面自称它在SWE-bench Verified测试中,以更小的参数规模,取得了比R1-0528更好的表现。尽管开源社区实测,它在Agentless(相对结构化工作流)的环境中表现确实出色,但在OpenHands(开放式探索任务评估框架)环境下的能力较弱。

MiniMax与月之暗面已经不止第一次“撞车”。今年年初,在DeepSeek发布R1前后,MiniMax开源了MiniMax-01,性能追平GPT-4o;月之暗面发布了K1.5并公开技术报告,表现不输满血版o1。

在今年之前,这两家AI原生的初创企业,更以自己的面向消费者市场的产品闻名。MiniMax的是星野(Talkie),月之暗面的是Kimi。现在,它们却纷纷对外传递出,自己还在努力探索AGI的形象。而当初一入场就迅速开源旗下大模型的百川智能与零一万物,却已然告别对AGI的追逐,转向了应用场景。

“六小虎”已经不再集体信仰AGI。最初,在ChatGPT问世后,中国坐不住了,百川智能、阶跃星辰、零一万物和月之暗面在2023年组团成立,智谱和MiniMax更早成立。这让“六小虎”的形象与OpenAI和AGI深深绑定在一起,也区别于上一代的“四小龙”——它们是商汤、旷视、云从、依图。

但“六小虎”的命运走向,早就已经埋下伏笔。虽然OpenAI验证了Transformer可行,只要快速跟上去,中国肯定也能做出自己的GPT-4。但是,缺钱、缺卡,其实也缺高质量的数据,如果只是简单跟随,这条路很快就走到了死胡同。在美国,GPT-5陷入难产,在中国,百模大战结束。

于是,“六小虎”的分化开始了两位互联网出身的搜索老兵,最先从AGI离场。百川智能刚成立的时候,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用,但在去年就转向了垂直模型。今年连应用场景也收缩了,创始人王小川在两周年全员信中“减少多余动作,专注医学方向”。零一万物刚成立的时候,旨在打造AI2.0全新平台,加速AGI到来,但也是在去年放弃了原定的万亿参数模型训练计划。今年初,创始人李开复表示“零一万物全面转向小而美”。

百川智能与零一万物的选择并不令人意外。在美国,除了OpenAI与Anthropic一边频繁落子应用产品,一边继续竞逐AGI,其他初创企业早已转向应用,或者选择被巨头并购;也许,除了从OpenAI出走的几员旧将以外,美国其他初创企业也经不起AGI这么烧钱。为了后来居上,xAI一个月要烧掉10亿美元,马斯克目前在到处融钱。

但初创企业从模型转向应用,往往也是九死一生。上一代的“四小龙”纷纷流血上市,它们的技术最终被证明并非不可逾越的门槛,有实际市场需求与现实世界数据的垂直行业巨头往往能做的更好。大模型正在商品化,开源模型也正在追

平前沿闭源模型,巨头可以单干,更小的市场意味着脏活苦活,它们能摆脱“四小龙”的覆辙吗?而且,没有了自己的底层模型,就意味着将命运交给了他人,Windsurf遭遇Anthropic断供的风险会发生在它们身上吗?

剩下的四家都选择了继续坚持,至少表态将继续坚持。除了前述MiniMax与月之暗面,阶跃星辰开源了一波Step系列多模态模型,并开始在终端智能寻找机遇。该公司创始人姜大昕称,在基座模型上面继续投入以追求智能的上限,仍然是当下最重要的,一条路是强化学习,一条路就是多模态理解生成一体化。智谱继续盯紧OpenAI,并承诺在年内发布包括基座模型、推理模型、多模态模型及Agent在内的全系列开源产品。

这次Minimax五连发的另外一重意思,是一心想做“模都”的上海,终于出了个能打上国际榜单的大模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
管泽元、余霜公布怀孕喜讯:我们小队有新成员啦

管泽元、余霜公布怀孕喜讯:我们小队有新成员啦

懂球帝
2026-03-24 21:53:05
通牒变停火?美国这场赌局已经露了底牌

通牒变停火?美国这场赌局已经露了底牌

看看新闻Knews
2026-03-23 20:53:13
美方涉台表述变了,台军已透底,美制武器将抵台,解放军也动了

美方涉台表述变了,台军已透底,美制武器将抵台,解放军也动了

近史博览
2026-03-24 22:19:27
三峡功臣、全国劳模陈文夫落马,他打造的无缝大坝也没堵住贪腐!

三峡功臣、全国劳模陈文夫落马,他打造的无缝大坝也没堵住贪腐!

至死不渝的爱情
2026-03-25 03:12:36
金价跌破千元,南京年轻人冲进金店

金价跌破千元,南京年轻人冲进金店

现代快报
2026-03-24 13:53:04
按2%征收!天津最新通知!

按2%征收!天津最新通知!

全接触狐狐
2026-03-24 20:56:09
吃以色列的饭,砸以色列的锅,若以色列“灭国”,有他们一半功劳

吃以色列的饭,砸以色列的锅,若以色列“灭国”,有他们一半功劳

易玄
2026-03-24 00:11:41
丹麦男友去世后,东北姑娘仍为他生下遗腹子,还为了公婆定居丹麦

丹麦男友去世后,东北姑娘仍为他生下遗腹子,还为了公婆定居丹麦

星星没有你亮
2026-03-22 08:48:35
一种新型出轨正在蔓延,不接吻不同居?却比婚外情更伤了

一种新型出轨正在蔓延,不接吻不同居?却比婚外情更伤了

游戏收藏指南
2026-03-25 02:38:51
形势大好!保住第4,东决再遇绿军和尼克斯,骑士还要完成3件大事

形势大好!保住第4,东决再遇绿军和尼克斯,骑士还要完成3件大事

一登侃球
2026-03-24 23:42:11
初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

娱乐圈笔娱君
2026-03-24 16:08:36
896线激光雷达下放20万元级,鸿蒙智行三车围猎主流赛道

896线激光雷达下放20万元级,鸿蒙智行三车围猎主流赛道

财经汽车
2026-03-23 20:02:58
白鹿张凌赫分手实锤?女方翻白眼不理睬,男方眼神卑微疑负了对方

白鹿张凌赫分手实锤?女方翻白眼不理睬,男方眼神卑微疑负了对方

小徐讲八卦
2026-02-07 08:19:32
全网都在说苏宁落幕,但真相刚好相反

全网都在说苏宁落幕,但真相刚好相反

无相商业趋势
2026-03-24 08:34:51
日媒:闯中国大使馆的日本人身份被曝光,高市十天前的话细思极恐

日媒:闯中国大使馆的日本人身份被曝光,高市十天前的话细思极恐

吕彍极限手工
2026-03-24 23:20:53
深夜利好,半导体龙头利润增3213%,8股高增5股暴雷,别踩雷

深夜利好,半导体龙头利润增3213%,8股高增5股暴雷,别踩雷

风风顺
2026-03-25 00:00:07
土库曼斯坦官宣,将本国最大气田交由中方开发,中石油成功拿下

土库曼斯坦官宣,将本国最大气田交由中方开发,中石油成功拿下

南权先生
2026-03-24 15:32:34
刚刚,安徽一市政协原主席被查!另有4人被通报

刚刚,安徽一市政协原主席被查!另有4人被通报

凤凰网安徽
2026-03-24 18:28:36
10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

孤单是寂寞的毒
2026-03-04 15:38:03
大快人心!日本持续暴跌达45%,中国人真不来了,高市已付出代价

大快人心!日本持续暴跌达45%,中国人真不来了,高市已付出代价

杰丝聊古今
2026-03-22 19:24:47
2026-03-25 06:27:00
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
338文章数 62关注度
往期回顾 全部

艺术要闻

《百花谱》,这个春天画花不用愁!

头条要闻

特朗普:伊朗同意“永不拥有核武器”

头条要闻

特朗普:伊朗同意“永不拥有核武器”

体育要闻

NBA最强左手射手,是个右撇子

娱乐要闻

张雪峰经抢救无效不幸去世 年仅41岁

财经要闻

特朗普再TACO 可以押注伊朗局势降级?

科技要闻

年仅41岁,教育名师张雪峰猝然离世

汽车要闻

尚界Z7双车预售22.98万起 问界M6预售26.98万起

态度原创

旅游
房产
家居
公开课
军事航空

旅游要闻

联袂演绎江南风华,浦东多个古镇将集中亮相2026上海旅游产业博览会

房产要闻

北上广深二手房集体回暖!三月小阳春行情全面兑现

家居要闻

智慧生活 奢享家居

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以色列媒体:美国计划于4月9日结束对伊朗战争

无障碍浏览 进入关怀版