沉寂了一段时间的大模型领域,又热闹起来了。虽然过时的“AI六小虎”说法已经鲜有人提,但作为国内第一批大模型企业,这六家企业的命运在沉默中已然走向了不同的剧本。一面是智谱和MiniMax,带着成绩单,向IPO发起冲刺,另一面则是各家或寻求新融资,或断臂求生。
上周,Kimi传出了完成最新一轮融资的消息,有传闻称该轮融资高达数亿美元。几乎在同一时间,国内大模型厂商MiniMax又开始了新一轮技术发布周,其中MiniMax-M2更是强势回归文本领域,直击海外巨头的核心腹地。
更早之前,9月底,智谱发布了GLM-4.6旗舰文本模型,作为GLM系列的最新版本,GLM-4.6被定为旗下最强的代码Coding模型,也跟此次M2的主打功能一致。也难怪有投资人评论称:“大模型要往什么方向做,从来不是秘密。”但话说回来,这些动作代表着不管是在资本市场还是模型赛道,中国大模型杀回来了。
“大模型的保质期只有三个月”
“回归”最明显的信号,莫过于MiniMax-M2在海外一发布就火爆了起来。其在全球权威测评榜单Artificial Analysis(AA)上,总分冲入了全球前五、开源第一,成功跻身全球文本模型的第一梯队,M2也是首个进入该梯队的中国模型。
最新数据显示,M2上线仅5天,在API整合平台OpenRouter上的实时调用token量已经排到全球第三,超过DeepSeek和Qwen;在编程场景中全球第三,并在HuggingFace Trending榜单第一。
在过去,MiniMax更多的以“视频、语音”等多模态大模型为大众所知,而这次发布周的重头戏却落在了MiniMax-M2,这款专为“Agent和Coding而生”的模型上。
图/海螺视频官网截图
更关键的是,M2综合成本API价格定为每百万Token输入0.3美元,输出1.2美元,同时在线提供TPS在100左右的推理服务。这个价格是Claude Sonnet 4.5的8%,而推理速度快了接近一倍。
对此,外界有分析称,这是MiniMax入局白热化细分领域的主动选择。 毕竟在基础模型这个强者恒强的赛道中,证明自己最佳的办法就是到最激烈的战场上去。
现在看来,这个战场就是Agent和代码这两大领域了。一个月前,Anthropic刚推出了Claude Sonnet 4.5,并定位为“世界上最强的编程模型”。紧接着,OpenAI在开发者大会上就发布了GPT-5 Pro,该模型将精准编码与智能体构建作为了核心升级的方向。
所以,MiniMax的做法并不难理解,也并非一时兴起。在6月技术周发布的MiniMax-M1系列模型就已经为这次更新做了探路和铺垫。而M2模型也并非是MiniMax首次打破海外技术垄断。同样在6月推出的视频生成大模型Hailuo 02就曾率先打破了国外垄断。从Hailuo 02到M2,MiniMax在4个月内完成了“视觉”、“语言”的双线登顶——这在历史上并没有先例。
不过,在模型赛道一直有个隐秘的共识——“大模型的保质期只有三个月”,也就是说一个模型在发布时拥有的技术领先优势窗口期正在急剧缩短。难怪minimax创始人闫俊杰认为“现在MiniMax最重要的目标不是增长,也不是收入,是加速技术迭代”。
这种选择不是孤立,可以看到全球头部厂商正以季度冲刺的节奏推动技术突破。例如,阿里通义千问Qwen 3系列从发布到重大更新仅用85天,较上一代周期缩短35%;OpenAI在2025年10月推出GPT-5 Pro,较同年8月发布的GPT-5新增工具调用与智能体能力。这种迭代速度使得模型性能的领先窗口期从半年级压缩至3个月。
商业化,还是商业化
大模型快速迭代的背后,是大模型厂商们期待商业化落地的最真实反馈。一个合乎逻辑的商业叙事是当技术迭代足够快,用户自然会被吸引过来。你看,2025年中,Anthropic凭借Claude系列在代码生成领域的突破,企业市场份额从12%跃升至32%,超越OpenAI(25%)成为新领跑者。这种格局变化就是源于用户对模型垂直能力的敏感程度超过品牌忠诚度。
在谈及这个模型的研发初衷时,MiniMax创始人闫俊杰用花名IO署名的官号文章中谈到:好的模型需要在效果、价格和推理速度上取得好的平衡,这几乎是一个“不可能三角”:海外最好的模型可以有不错的效果,但是价格非常贵且推理速度比较慢;国内的模型价格也相对便宜,但是效果和推理速度有差距。这也导致了现有的Agent产品为了有好的效果,往往价格很贵,或者速度相对较慢,比如不少Agent产品包月的价格经常到达几十美金甚至几百美金,完成一个任务经常需要小时量级。我们一直在探索,能不能有一款模型能在效果、价格和速度上能取得比较好的平衡,从而让更多的人能受益于Agent时代的智能提升,延续我们Intellience with Everyone的愿景。
图/海螺视频官网截图
概括起来,M2的出现是为了让更多的人,能用得起全球第一梯队的模型。当性能指标不再是唯一竞争焦点,技术的护城河就开始变浅,实用性的价值就开始占了上风。M2在海外上线以来,全球开发者用脚投票,通过API快速接入M2,OpenRouter全球第三是中国模型迄今最好成绩,排名超越OpenAI和Anthropic,中国模型正在席卷硅谷的海外开发者,这一切都是M2模型的自然增长。
MiniMax的选择也代表了中国大模型的一种典型解法——重落地,这也是它的优势领域。数据更为直观,截至9月份,MiniMax的自研多模态模型及AI原生应用已累计为来自超过200个国家及地区的逾1.57亿名个人用户,以及来自超过90个国家及地区的50,000余名企业客户以及开发者提供服务。
MiniMax的早期投资人曾提到:“相比于国内其他大模型厂商,MiniMax的营收更市场化,现金流更健康。这也是它的估值增长能够领跑的重要原因之一。”
当然,这背后离不开创始团队对AI商业化的独到理解。
与其他大模型公司不同的是,MiniMax的核心人员都亲历了“AI 1.0”到“AI 2.0”的产业阵痛,这种稀有的经历,让他们更能明白技术落地的重要性,不是单一的项目制,而是开放API,发力To B,成为那位“先让你赚钱的朋友”。
这种务实的态度,也被资本市场迅速买单:红杉中国、阿里、高瓴、IDG、明势、腾讯、米哈游和上海国资的陆续加注,估值增速领跑“AI六小虎”,还在今年正式递表港交所,准备拿下“中国大模型第一股”的头衔。
上市前的再冲刺
谈到上市,还记得在今年6月发布周的时候,正好赶上MiniMax刚被传出上市的消息,让低调的MiniMax成为了聚光灯下的焦点。巧合的是,与这次发布周同时出现的,是OpenAI正在筹备IPO的消息。据路透社援引三名知情人士消息称,OpenAI估值最高可能达到1万亿美元,这或将成为历史上规模最大的IPO之一。虽然OpenA很快否认了上市的时间表,但却向外界透露了一个关键信息—年营收远超外界预计的130亿美元(约合人民币926亿元)。
同样,Anthropic在9月完成130亿美元F轮融资时,曾公布到2025年8月,其年化收入已超过50亿美元,商业化能力也成为了支撑估值的关键,这轮融资让Anthropic的估值达到了1830亿美元。
可见,在这个日渐务实,竞争同质化的市场,撑起估值想象空间的关键,最终落在了商业化这一变量上。
毋庸置疑,Deepseek的出现让中美大模型市场出现了巨大的分野,尤其是在资本市场,昔日风光一时的“AI六小虎”进入了不同程度的调整期,除了技术、人员的更迭,更重要的是估值和市场认知都进行了回调。而再次让国内大模型厂商找回信心的方式,除了持续的融资就是商业化的落地,从结果来看,智谱和MiniMax确实做到了。在融资方面,今年上半年,智谱接连完成多轮大额融资,并多为地方政府加注,相比之下,MiniMax延续一贯的低调,虽完成多轮融资,但几乎没有对外官宣,最新估值近300亿。基于此,有分析指出,此次发布的M2模型是MiniMax向企业端用户的再一次发力,是MiniMax在文本模型全球竞争中再拿下一城,并已经开始切Anthropic等toB领域的份额。
在大模型的现有叙事下,MiniMax有着近乎完美的画像——全球多模态top厂商的估值想象,热门细分赛道的精准卡位,充足的现金储备。如今MiniMax带着M2杀回文本模型领域,在原有多模态的基础上,正在构建一个能让C端创作者、B端企业同时用得起的大模型生态。
下一步,大模型的趋势是多模态融合,目前市场上拥有综合研发积累的公司也已收敛到OpenAI、Google、字节等少数几个公司内,全模态领先的MiniMax是其中唯一一家创业公司。
封面来源:海螺视频官网截图
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.