网易首页 > 网易号 > 正文 申请入驻

“狠人”闫俊杰,闯关IPO

0
分享至

“MiniMax在探索一条之前没有被验证过的路。”

文|《中国企业家》记者孔月昕

编辑|马吉英

头图来源|受访者

6月17日,在MiniMax官方公众号发布了全球首个开源大规模混合架构推理模型MiniMax-M1后,公司创始人闫俊杰随即转发到朋友圈,并配文称:“第一次感觉到大山不是不能翻越。”

之所以这么说,是因为M1模型通过以闪电注意力机制为主的混合架构和更快的强化学习算法CISPO(一种强化学习算法,通过裁剪重要性采样权重提升强化学习效率)两项技术突破,实现了深度推理的显著高效,并提升了强化学习的效率。据公司介绍,整个强化学习阶段只用了512块H800三周的时间,换算成(算力)租赁成本为53.47万美元。

除了M1外,在之后的4个工作日里,MiniMax又连续发布了Hailuo 02视频生成模型、MiniMax Agent通用智能体、Hailuo Video Agent视频创作智能体、Voice Design音色设计。在MiniMax Agent发布当天,闫俊杰的朋友圈配文是:“研发中越来越强烈的感受是AI的价值可以开始被经济来衡量。”

与此同时,MiniMax在资本市场也有新消息传出。6月,公司被爆出正考虑在港股IPO的消息。

这一消息并非空穴来风:早在2024年,MiniMax旗下产品星野AI(Talkie)的营收已突破千万美元,在海外市场表现尤其出色,下载量曾超越CharacterAI,成为美国AI应用Top4。财务实力的支撑更为关键——知情人士透露,公司今年以来通过多轮未公开融资,积累了充足的现金储备(约十几亿美元)。近期还完成了Pre-IPO融资,使其成为大模型创业公司中资金最雄厚的玩家。

截至发稿,对于资本市场相关进展,公司方面并未正面回应。

充足的现金储备让闫俊杰具备了高度的战略自主权,也让这位“赌性”很重的创业者,能坚定推行“加速技术迭代”的发展路径。明势创投合伙人夏令此前参加活动时,曾评价MiniMax是“一家兼具野心、资源实力与非共识坚持的公司”,明势创投创始合伙人黄明明则称,“闫俊杰是一个‘狠人’,在资源等方方面面有限的情况下,他还是专注在模型研发上。只有这样的企业家可能才能走得更远,走到终局。”

锚定MoE架构破局

2021年12月,商汤上市前夕,作为副总裁、研究院副院长和智慧城市事业群CTO的闫俊杰,选择离开商汤。

在闫俊杰看来,2020年之前,AlphaGo做过很多东西,整个社会对人工智能的关注度和期待值都非常高,且国内外都投入了大量的研发资金,但当时的人工智能只能做一些非常简单的事,比如人脸识别、语音识别等,创造的社会价值比较低。

对于当时的闫俊杰来说,这是一件“很痛苦的事”,他逐渐意识到,核心因素在于当时的人工智能不够通用。

“当时我们用虚拟模型解决客户的问题,一旦客户有无数个问题,就得做无数个模型,即每做一个模型就要训练一次,还要导数据,整个生产链条非常慢。因此我们只能服务一些大客户,因为企业需要定制,但定制的成本周期很长,商业模式也变成了定制模型。”闫俊杰回忆。

他在思考的是,“如果不做定制模型,把模型做得通用,是不是就可以服务普通人了?”

同时,闫俊杰恰好看到了OpenAI关于GPT-3的论文,并受到启发,“把(GPT)模型放大10倍,技术路线就可能成立了。”

不过,做通用的工具和闫俊杰在商汤的研发路线完全不一样,需要的人才、组织结构也不一样,闫俊杰由此发现,“这应该是一家新兴公司的机会。”2022年初,MiniMax正式成立。

云启资本是MiniMax早期投资方之一,合伙人陈昱最初跟闫俊杰接触时,就发现闫俊杰是一位野心比较大的创业者,“他想做中国的OpenAI或DeepMind,最终实现通用人工智能”。

在技术路线的选择上,闫俊杰也非常大胆。

2023年下半年,大部分中国同行还在继续迭代稠密模型(dense model),它能更稳健地提升大模型性能。闫俊杰则几乎把全部研发和算力资源都投到了一件更不确定的事情上——MoE(混合专家系统)模型。

黄明明回忆,彼时,MoE在硅谷都不是主流共识,只有OpenAI在做,甚至MoE的提出者,都没有把MoE这条路坚持走下去。

在闫俊杰看来,尽管OpenAI尚未公开GPT-5,但其内部已完成了该模型的训练。GPT-5的训练需要高达5万张卡的算力,短期内,国内难以达到3万张卡的规模,因此若要实现与GPT-5相当的效果,必须采用更高效的算法(MoE),否则就永远追不上(OpenAI)。因此,MoE也成了团队“一定要做的事情”。

2023年夏天,闫俊杰带领MiniMax团队开始专注研发MoE。

黄明明认为,闫俊杰看上去是一个很温和的人,实际上他很疯狂。在认定终极目标后,他会把所有资源all in,去赌这个事情。

“他把当时手头80%的算力资源都用来推MoE。”黄明明说,“前两次是失败的,直到第三次成了,他才跑过来跟我们(投资人)讲,MoE差不多能搞定了。”

黄明明问闫俊杰:“为什么你要赌这么大?你赌不出来,可能这家公司就挂了。”

闫俊杰的回复是,“只有我把MoE做出来,才能用更低的成本向更高的模型阶段去演进,否则用的是一个不可估量的成本去往下一步,没有一家公司能支持这样token的消耗量去往更高的平台进化。”

应对DeepSeek,慢了一步

2025年1月15日,MiniMax发布了首个开源模型MiniMax-01系列。

在接受晚点采访时,闫俊杰指出,开源的核心价值在于加速技术进化。“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”闫俊杰说。想清楚“智能水平的提升,没那么依赖用户规模”后,闫俊杰做出了取舍,他认为现在MiniMax最重要的目标不是增长,也不是收入,是“加速技术迭代”,并坚定了要做一家技术驱动型公司的念头,开始有意识地打造技术品牌。

但从行业变化看,闫俊杰还是“慢”了一步。2024年12月26日,DeepSeek-V3发布后,在业内形成一定的口碑和品牌效应。2025年1月20日,DeepSeek-R1发布,在大众层面掀起的声量迅速盖过了相对低调的MiniMax,进一步抢夺了C端用户的心智。

面对汹涌而来的DeepSeek冲击波,国内模型厂商主要分成了两队,一队是积极拥抱,大力宣传旗下产品接入DeepSeek;另一队是坚决不接入DeepSeek,并死磕自研自己的推理模型。

MiniMax的选择是,在国内C端应用上坚持不接入DeepSeek,只在海外的AI应用上选择接入DeepSeek。

同时,据MiniMax内部员工透露,DeepSeek发布并没有影响他们研发团队的节奏,内部还是保持原有计划,专注且低调地进行技术研发。

黄明明也表示,他们非常认可MiniMax持续专注在底层模型的研发上。“好的应用或好的产品,都是模型能力自然而然的体现,模型能力强了,一定会做出好的产品。事实证明,当模型能力不够强时,做出的产品就需要很多缝缝补补,打很多补丁,耗费巨大的人力和物力,并丧失你在底层模型上的专注度。”黄明明说。

6月中旬,MiniMax连续发布了包括基础模型及应用在内的5款产品,业内对于其模型和应用的产品评价比较正面,Hugging Face工程师王铁震告诉《中国企业家》:“MiniMax在探索一条之前没有被验证过的路,非常有价值。”

(注:Hugging Face是一家成立于2016年的美国人工智能公司,致力于构建开源的机器学习社区和平台,提供丰富的预训练模型、数据集和工具,帮助开发者更便捷地构建、训练和部署AI应用。)

不过,MiniMax-M1系列模型并未引发大范围轰动。截至7月10日,其在Hugging Face最热帖下载量仅25.2K,GitHub最热帖收藏量仅3K——这一数据明显低于Google、Meta今年初发布的开源模型,也逊色于DeepSeek-R1的收藏及下载量。

部分Agent创业者反馈,虽注意到MiniMax M1模型的发布,但因自身产品上线排期紧张,暂未及时投入测试。另一位AI领域创业者告诉《中国企业家》,当前海外AI领域热点频发(如GPT-5发布在即,Meta新模型迭代),分散了行业注意力,客观上削弱了M1的传播声量。在他看来,国际模型技术仍具备一定领先优势。

对此,一位MiniMax投资人表示,MiniMax一贯的风格是相对低调和克制,它最后交付的产品口碑,可能比大家记住模型名字或下载量更重要。

“你只有最后交付一个产品,才容易做商业化,才有可能达到上市的体量。快手的可灵交付的也是一个生产工具,大家看重的也是产品,而非快手的视频模型。”该投资人补充道。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当“观察者网”说出底线二字的时候,我还是笑了

当“观察者网”说出底线二字的时候,我还是笑了

林中木白
2026-03-26 14:23:04
演员王传君发文宣布退出

演员王传君发文宣布退出

美芽
2026-03-26 12:05:06
突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

健康科普365
2026-03-26 09:57:24
伊朗称正在搜捕逃亡美军

伊朗称正在搜捕逃亡美军

界面新闻
2026-03-25 23:21:14
利空突袭,全线杀跌!

利空突袭,全线杀跌!

中国基金报
2026-03-26 13:16:51
倒计时开始!特朗普将迎来终极翻车时刻!

倒计时开始!特朗普将迎来终极翻车时刻!

一个坏土豆
2026-03-25 20:56:19
特朗普,开始甩锅

特朗普,开始甩锅

中国基金报
2026-03-26 07:57:39
我就不信张一山没有后悔过吗?这么美的前任拱手让出去了

我就不信张一山没有后悔过吗?这么美的前任拱手让出去了

喜欢历史的阿繁
2026-03-26 09:20:58
人民日报对张雪峰的评价——

人民日报对张雪峰的评价——

叶初七
2026-03-26 10:03:04
“中园石化”被立案调查

“中园石化”被立案调查

每日经济新闻
2026-03-25 11:13:18
伊朗或开辟新战线!伊朗外长:霍尔木兹海峡只对敌人关闭,中国、俄罗斯、巴基斯坦、伊拉克、印度、孟加拉国等国船只都安全通过了

伊朗或开辟新战线!伊朗外长:霍尔木兹海峡只对敌人关闭,中国、俄罗斯、巴基斯坦、伊拉克、印度、孟加拉国等国船只都安全通过了

每日经济新闻
2026-03-26 09:53:07
15战14胜,加时掀翻东部第一!新鹰王27+8+12证明贱卖特雷杨有理

15战14胜,加时掀翻东部第一!新鹰王27+8+12证明贱卖特雷杨有理

锅子篮球
2026-03-26 11:25:55
收评:三大指数均跌超1% 两市成交额跌破2万亿

收评:三大指数均跌超1% 两市成交额跌破2万亿

财联社
2026-03-26 15:02:09
周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

周杰伦继续割韭菜!网友一针见血:他唯一和华流关系最大的是割大陆韭菜

爆角追踪
2026-03-26 08:56:24
A股:低开低走跳水大跌,发生了什么?刚刚,新华社传来重磅消息

A股:低开低走跳水大跌,发生了什么?刚刚,新华社传来重磅消息

虎哥闲聊
2026-03-26 12:06:24
震惊!聊天框打出“飞机”,华为是民航客机,苹果是螺旋桨小飞机

震惊!聊天框打出“飞机”,华为是民航客机,苹果是螺旋桨小飞机

火山詩话
2026-03-26 09:43:22
中方驳斥“闯馆事件”日方荒谬说法:你见过未经允许持刀进入使馆同大使交谈的先例吗?

中方驳斥“闯馆事件”日方荒谬说法:你见过未经允许持刀进入使馆同大使交谈的先例吗?

环球网资讯
2026-03-26 07:09:09
继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

180视角
2026-03-26 11:52:12
张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

每日人物
2026-03-26 13:34:51
日本网民真怕了,呼吁严惩闯入中国使馆的暴徒,防止226事件再现

日本网民真怕了,呼吁严惩闯入中国使馆的暴徒,防止226事件再现

知法而形
2026-03-25 18:38:56
2026-03-26 15:52:49
中国企业家杂志 incentive-icons
中国企业家杂志
本账号由《中国企业家》杂志社有限责任公司运营
3085文章数 19881关注度
往期回顾 全部

财经要闻

黄仁勋:芯片公司的时代已经结束了

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
游戏
房产
艺术
旅游

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被查

DOTA2 7.41版本大更新!再见了命石,选择困难症有福了

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

艺术要闻

哪一座桥不是风景?

旅游要闻

济南动物园“花朝荟”系列活动浪漫上演

无障碍浏览 进入关怀版