昨天看完了罗永浩访谈MiniMax创始人闫俊杰,整个访谈3小时50分,其中许多观点非常有启发,建议你完整看一遍。如果你确实没时间,至少认真看完这篇文章,要知道这可是AI大模型独角兽公司创始人,花了几千万美金烧出来的真知灼见,含金量非常高。
![]()
01 烧掉5000万美金,终于不慌了
在K哥看来,MiniMax是一家对技术有独特追求的公司,毕竟创始人是顶级技术专家。早在2023年,大家还在琢磨怎么把LLaMA复现一遍,MiniMax已经开始搞MoE(混合专家模型)了。
这个决定有多疯?当时除了OpenAI自己玩得挺溜但又不开源,外面基本没人知道这玩意儿该怎么整。没有开源社区的作业可以抄,没有GitHub上的代码可以参考,全靠自己一点点试。
试的过程就是不断失败,连着失败了3到4次。每失败一次,两个月的研发时间就白费了,1500万美金的算力成本直接打水漂。算下来,光是这几次失败,就烧掉了四五千万美金。
换成一般公司,估计早就被董事会按在地上摩擦了。但闫俊杰的逻辑挺简单:如果相信MoE架构的上限更高,那为了那个能支撑起大几千亿参数的天花板,这钱就得烧。只要方向对,就不能算小账。
MiniMax还同时开了三条战线:文本、语音、视觉。
外人看来这简直是“兵力分散”的教科书式反面案例。一个早期创业公司,资源本来就紧张,你不集中火力打一个点,反而要三线作战?
闫俊杰的逻辑还是那套第一性原理:真正的AGI肯定是多模态的。既然相信Scaling Law,相信不同模态在深度学习层面本质上是一回事,那就算现在算力不够,做不了“原生多模态”,也得把它们当成三个独立模型先训练起来,为最终的融合做准备。
他不想为了短期的技术形象去跟媒体讲故事,而是真的在为解决根本问题做准备。哪怕要走之字形路线,哪怕要长期追赶,也认了。
更纯粹的技术创业,不是为了好看,是为了走得远。
02 被DeepSeek干懵,然后顿悟
2025年春节,DeepSeek R1横空出世,把全球大模型圈子给干懵了。
那种冲击感,不亚于当年ChatGPT刚出来的时候。所有人都沉默了好长一段时间,闫俊杰也不例外。
他跟老罗坦言,当时确实陷入了长时间的自我反思:是技术路线错了吗?是团队要求降低了?还是我们在追求AGI的路上不够坚定?
摆在所有大模型公司面前的其实就两条路:要么继续死磕技术,要么赶紧想办法“开源节流”,早点把商业收入做起来。
闫俊杰选了前者,把自己彻底扔进模型技术这个维度去死磕。
他的判断很明确:华山只有一条路,而且狭路相逢不能躲。那些之前还在考虑的“沿途下蛋”做产品工厂的路线,直接砍掉了。
有意思的是,他在战略上聚焦技术的同时,在组织上做了个特别实在的动作,就是发更多的钱。
用最直接的方式,让大家把丢掉的信心捡回来,把分散的注意力聚回来。忠于目标,做该做的事,不要有羞耻感。
2025年,MiniMax连着打赢了三场硬仗。
第一场,走非共识技术路线
1月份,MiniMax发布了国内首个线性注意力架构模型MiniMax-Text 01,算是走了一条非共识技术路线。到了6月,开源了全球首个大规模混合架构推理模型MiniMax-M1。K哥当时写了篇文章做了详细分析。
![]()
虽然后来的M2没有完全沿用这个架构,但这种敢于偏离主流的探索本身就很有含金量。它证明了MiniMax不是那种等着硅谷发论文再跟进的好学生,而是真的敢去无人区找更优解。
第二场,底层算法被科技巨头采用
在M1模型里,MiniMax提出了一个叫CISPO的强化学习算法。后来Meta发布的ScaleRL训练框架也用了这个算法。中国创业公司在底层算法逻辑上,对国际巨头完成了一次罕见且硬核的技术输出。
![]()
第三场,定义了交互行业标准
到了10月,随着M2模型发布,MiniMax首次把Interleaved Thinking(交错思维链)推向了行业标准。这种让模型“像人一样边想边做”的能力,很快就得到了OpenRouter等国外知名开发者平台的支持。
这一次,不再是硅谷定义规则,MiniMax在定义什么叫更好的交互。
打完这三场仗,闫俊杰手里的拼图终于齐了。
闫俊杰说,语音模型两年前就做到国际领先了,视频生成一年前冲到国际前列,音乐模型现在是全球三强,唯独语言模型之前一直差点火候。但随着M2发布,这块短板也补上了,开始被国际开发者用来做Agent和写代码。
客观来看,MiniMax是中国唯一一家,在文本、视频、语音、音乐全模态上都做到国际领先的公司。
说这话的时候,闫俊杰明显比年初那会儿松弛多了。
03 只有5家大模型,最终能留在牌桌上
闫俊杰向老罗描绘了一个,比外界认知更残酷的全球AI技术竞争格局。
他认为,在美国,真正能坐在大模型牌桌上的其实只有四家公司:OpenAI、Google、Anthropic,还有X.AI。
那MiniMax的位置在哪儿?闫俊杰的目标是成为全球极少数具备全模态整合能力的公司,而且是中国唯一一家在文本、视频、语音、音乐全模态上都做到国际领先的。
让他真正有自信的,是中国公司独特的效率优势。
在闫俊杰看来,美国那四家核心公司,估值和收入可能是中国公司的100倍,但技术领先幅度可能只剩5%。中国公司花美国同行1/50的钱,做出来的效果只差5%,而且这个差距还在缩小。当全模态的数据和模型完成最终整合时,会出现从量变到质变的时刻。
在采访里闫俊杰说,如果要反思技术做得好到底需要什么,他总结为两个词:想象力和自信。
美国企业在自信方面做得很好,他们敢于讲我要引领这个行业。中国科技企业要更上一个层面,要引领世界,归根到底也需要这种坦荡的自信。
曾几何时,在中国做一家真正的技术公司,想很纯粹地依托技术本身形成大的商业价值闭环,是无比艰难的。以至于一段时间以来,技术理想这个真正的核动力,在没做出伟大成果之前,都是不足为外人道也的东西。甚至在商业世界公开谈理想和追求,都成了有点羞耻感的事。
但到了今天这个新的技术时代,情况应该开始改变了。
该羞耻的是那些只看见历史、不敢下注未来的人,不是这些技术创业者们。
MiniMax给中国科技公司打了个样,希望他们继续纵情向前。也希望更多新一代中国技术创业者,在这个全新的技术时代,保持纯粹,勇敢追逐技术理想。
来源 | 技术领导力(ID:jishulingdaoli)
作者 | Mr.K ; 编辑 | 虾饺
内容仅代表作者独立观点,不代表早读课立场
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.