网易首页 > 网易号 > 正文 申请入驻

“狠人”闫俊杰,闯关IPO

0
分享至



“MiniMax在探索一条之前没有被验证过的路。”

文|《中国企业家》记者孔月昕

编辑|马吉英

头图来源|受访者

6月17日,在MiniMax官方公众号发布了全球首个开源大规模混合架构推理模型MiniMax-M1后,公司创始人闫俊杰随即转发到朋友圈,并配文称:“第一次感觉到大山不是不能翻越。”

之所以这么说,是因为M1模型通过以闪电注意力机制为主的混合架构和更快的强化学习算法CISPO(一种强化学习算法,通过裁剪重要性采样权重提升强化学习效率)两项技术突破,实现了深度推理的显著高效,并提升了强化学习的效率。据公司介绍,整个强化学习阶段只用了512块H800三周的时间,换算成(算力)租赁成本为53.47万美元。

除了M1外,在之后的4个工作日里,MiniMax又连续发布了Hailuo 02视频生成模型、MiniMax Agent通用智能体、Hailuo Video Agent视频创作智能体、Voice Design音色设计。在MiniMax Agent发布当天,闫俊杰的朋友圈配文是:“研发中越来越强烈的感受是AI的价值可以开始被经济来衡量。”

与此同时,MiniMax在资本市场也有新消息传出。6月,公司被爆出正考虑在港股IPO的消息。


来源:受访者

这一消息并非空穴来风:早在2024年,MiniMax旗下产品星野AI(Talkie)的营收已突破千万美元,在海外市场表现尤其出色,下载量曾超越CharacterAI,成为美国AI应用Top4。财务实力的支撑更为关键——知情人士透露,公司今年以来通过多轮未公开融资,积累了充足的现金储备(约十几亿美元)。近期还完成了Pre-IPO融资,使其成为大模型创业公司中资金最雄厚的玩家。

截至发稿,对于资本市场相关进展,公司方面并未正面回应。

充足的现金储备让闫俊杰具备了高度的战略自主权,也让这位“赌性”很重的创业者,能坚定推行“加速技术迭代”的发展路径。明势创投合伙人夏令此前参加活动时,曾评价MiniMax是“一家兼具野心、资源实力与非共识坚持的公司”,明势创投创始合伙人黄明明则称,“闫俊杰是一个‘狠人’,在资源等方方面面有限的情况下,他还是专注在模型研发上。只有这样的企业家可能才能走得更远,走到终局。”

锚定MoE架构破局

2021年12月,商汤上市前夕,作为副总裁、研究院副院长和智慧城市事业群CTO的闫俊杰,选择离开商汤。

在闫俊杰看来,2020年之前,AlphaGo做过很多东西,整个社会对人工智能的关注度和期待值都非常高,且国内外都投入了大量的研发资金,但当时的人工智能只能做一些非常简单的事,比如人脸识别、语音识别等,创造的社会价值比较低。

对于当时的闫俊杰来说,这是一件“很痛苦的事”,他逐渐意识到,核心因素在于当时的人工智能不够通用。


来源:AI生成

“当时我们用虚拟模型解决客户的问题,一旦客户有无数个问题,就得做无数个模型,即每做一个模型就要训练一次,还要导数据,整个生产链条非常慢。因此我们只能服务一些大客户,因为企业需要定制,但定制的成本周期很长,商业模式也变成了定制模型。”闫俊杰回忆。

他在思考的是,“如果不做定制模型,把模型做得通用,是不是就可以服务普通人了?”

同时,闫俊杰恰好看到了OpenAI关于GPT-3的论文,并受到启发,“把(GPT)模型放大10倍,技术路线就可能成立了。”

不过,做通用的工具和闫俊杰在商汤的研发路线完全不一样,需要的人才、组织结构也不一样,闫俊杰由此发现,“这应该是一家新兴公司的机会。”2022年初,MiniMax正式成立。

云启资本是MiniMax早期投资方之一,合伙人陈昱最初跟闫俊杰接触时,就发现闫俊杰是一位野心比较大的创业者,“他想做中国的OpenAI或DeepMind,最终实现通用人工智能”。

在技术路线的选择上,闫俊杰也非常大胆。

2023年下半年,大部分中国同行还在继续迭代稠密模型(dense model),它能更稳健地提升大模型性能。闫俊杰则几乎把全部研发和算力资源都投到了一件更不确定的事情上——MoE(混合专家系统)模型。

黄明明回忆,彼时,MoE在硅谷都不是主流共识,只有OpenAI在做,甚至MoE的提出者,都没有把MoE这条路坚持走下去。

在闫俊杰看来,尽管OpenAI尚未公开GPT-5,但其内部已完成了该模型的训练。GPT-5的训练需要高达5万张卡的算力,短期内,国内难以达到3万张卡的规模,因此若要实现与GPT-5相当的效果,必须采用更高效的算法(MoE),否则就永远追不上(OpenAI)。因此,MoE也成了团队“一定要做的事情”。

2023年夏天,闫俊杰带领MiniMax团队开始专注研发MoE。

黄明明认为,闫俊杰看上去是一个很温和的人,实际上他很疯狂。在认定终极目标后,他会把所有资源all in,去赌这个事情。

“他把当时手头80%的算力资源都用来推MoE。”黄明明说,“前两次是失败的,直到第三次成了,他才跑过来跟我们(投资人)讲,MoE差不多能搞定了。”

黄明明问闫俊杰:“为什么你要赌这么大?你赌不出来,可能这家公司就挂了。”

闫俊杰的回复是,“只有我把MoE做出来,才能用更低的成本向更高的模型阶段去演进,否则用的是一个不可估量的成本去往下一步,没有一家公司能支持这样token的消耗量去往更高的平台进化。”

应对DeepSeek,慢了一步

2025年1月15日,MiniMax发布了首个开源模型MiniMax-01系列。

在接受晚点采访时,闫俊杰指出,开源的核心价值在于加速技术进化。“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”闫俊杰说。想清楚“智能水平的提升,没那么依赖用户规模”后,闫俊杰做出了取舍,他认为现在MiniMax最重要的目标不是增长,也不是收入,是“加速技术迭代”,并坚定了要做一家技术驱动型公司的念头,开始有意识地打造技术品牌。

但从行业变化看,闫俊杰还是“慢”了一步。2024年12月26日,DeepSeek-V3发布后,在业内形成一定的口碑和品牌效应。2025年1月20日,DeepSeek-R1发布,在大众层面掀起的声量迅速盖过了相对低调的MiniMax,进一步抢夺了C端用户的心智。

面对汹涌而来的DeepSeek冲击波,国内模型厂商主要分成了两队,一队是积极拥抱,大力宣传旗下产品接入DeepSeek;另一队是坚决不接入DeepSeek,并死磕自研自己的推理模型。

MiniMax的选择是,在国内C端应用上坚持不接入DeepSeek,只在海外的AI应用上选择接入DeepSeek。

同时,据MiniMax内部员工透露,DeepSeek发布并没有影响他们研发团队的节奏,内部还是保持原有计划,专注且低调地进行技术研发。


来源:视觉中国

黄明明也表示,他们非常认可MiniMax持续专注在底层模型的研发上。“好的应用或好的产品,都是模型能力自然而然的体现,模型能力强了,一定会做出好的产品。事实证明,当模型能力不够强时,做出的产品就需要很多缝缝补补,打很多补丁,耗费巨大的人力和物力,并丧失你在底层模型上的专注度。”黄明明说。

6月中旬,MiniMax连续发布了包括基础模型及应用在内的5款产品,业内对于其模型和应用的产品评价比较正面,Hugging Face工程师王铁震告诉《中国企业家》:“MiniMax在探索一条之前没有被验证过的路,非常有价值。”

(注:Hugging Face是一家成立于2016年的美国人工智能公司,致力于构建开源的机器学习社区和平台,提供丰富的预训练模型、数据集和工具,帮助开发者更便捷地构建、训练和部署AI应用。)

不过,MiniMax-M1系列模型并未引发大范围轰动。截至7月10日,其在Hugging Face最热帖下载量仅25.2K,GitHub最热帖收藏量仅3K——这一数据明显低于Google、Meta今年初发布的开源模型,也逊色于DeepSeek-R1的收藏及下载量。

部分Agent创业者反馈,虽注意到MiniMax M1模型的发布,但因自身产品上线排期紧张,暂未及时投入测试。另一位AI领域创业者告诉《中国企业家》,当前海外AI领域热点频发(如GPT-5发布在即,Meta新模型迭代),分散了行业注意力,客观上削弱了M1的传播声量。在他看来,国际模型技术仍具备一定领先优势。

对此,一位MiniMax投资人表示,MiniMax一贯的风格是相对低调和克制,它最后交付的产品口碑,可能比大家记住模型名字或下载量更重要。

“你只有最后交付一个产品,才容易做商业化,才有可能达到上市的体量。快手的可灵交付的也是一个生产工具,大家看重的也是产品,而非快手的视频模型。”该投资人补充道。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
警惕!山西流感H3N2毒株流行 学生为主要高发人群

警惕!山西流感H3N2毒株流行 学生为主要高发人群

极目新闻
2025-11-15 11:22:33
安世中国:仍有能力、有信心发放全体员工足额工资和福利

安世中国:仍有能力、有信心发放全体员工足额工资和福利

界面新闻
2025-11-14 17:39:20
李诞直播徐志胜私事,难堪话题引多人围观,徐志胜的回击很有水平

李诞直播徐志胜私事,难堪话题引多人围观,徐志胜的回击很有水平

娱乐独家内幕
2025-11-14 03:30:59
杭州女子买小米SU7后巨后悔,网友:订金给他,保命要紧

杭州女子买小米SU7后巨后悔,网友:订金给他,保命要紧

热点菌本君
2025-11-15 16:02:03
越秀领导,被央企告了!

越秀领导,被央企告了!

风声声
2025-11-14 16:00:55
2-0!阿根廷夺3连胜为今年收官 38岁梅西传射+差3助成历史助攻王

2-0!阿根廷夺3连胜为今年收官 38岁梅西传射+差3助成历史助攻王

我爱英超
2025-11-15 06:02:29
前TVB小生地铁被偶遇!染金发挺肚腩!网友盛赞:胖了还是帅

前TVB小生地铁被偶遇!染金发挺肚腩!网友盛赞:胖了还是帅

我爱追港剧
2025-11-13 08:07:42
中方定性 “侵略”!日本政客踩台海红线,外援全扑空还遭俄补刀

中方定性 “侵略”!日本政客踩台海红线,外援全扑空还遭俄补刀

吃货的分享
2025-11-16 02:39:47
黄磊回应暂停《向往的生活》,节目嘉宾一场戏仅挣300元不敢体检

黄磊回应暂停《向往的生活》,节目嘉宾一场戏仅挣300元不敢体检

陈意小可爱
2025-11-15 16:21:46
魔兽时光服:528大佬纷纷发难,雷火开启退款通道,进服资格保留

魔兽时光服:528大佬纷纷发难,雷火开启退款通道,进服资格保留

胖哥游戏说
2025-11-15 17:47:45
陈伟霆母亲首次探望孙子,何穗亲自拍照热情迎接!

陈伟霆母亲首次探望孙子,何穗亲自拍照热情迎接!

小巍解说
2025-11-14 01:04:07
赛事点评,全运会女足决赛江苏女足是如何夺冠的

赛事点评,全运会女足决赛江苏女足是如何夺冠的

酷马西者野
2025-11-15 22:51:44
朝鲜今年对俄供弹锐减,乌情报称一半弹药“老旧”需翻新

朝鲜今年对俄供弹锐减,乌情报称一半弹药“老旧”需翻新

桂系007
2025-11-15 23:56:34
马筱梅透露:小箖箖总和她抱怨不想上体育课!筱梅也是没有办法了

马筱梅透露:小箖箖总和她抱怨不想上体育课!筱梅也是没有办法了

乐悠悠娱乐
2025-11-15 11:34:57
邓家佳在重庆吃烤鱼被偶遇,小姨妈气质绝了 脸小精致 美得恰到好处

邓家佳在重庆吃烤鱼被偶遇,小姨妈气质绝了 脸小精致 美得恰到好处

陈意小可爱
2025-11-16 03:34:50
就在今天!樊振东4-2王楚钦,创造全运会史无前例66年纪录,奇迹

就在今天!樊振东4-2王楚钦,创造全运会史无前例66年纪录,奇迹

侃球熊弟
2025-11-15 13:58:24
亏损17.9亿!北京1-9月住宿餐饮中小微企营收还在跌

亏损17.9亿!北京1-9月住宿餐饮中小微企营收还在跌

小星球探索
2025-11-15 19:18:30
关税突发,特朗普最新签署!降息,大消息!黄金暴跌,美股突变!

关税突发,特朗普最新签署!降息,大消息!黄金暴跌,美股突变!

证券时报e公司
2025-11-15 08:00:59
那年送女同学回家遇山洪,她脱光烤火命令:转头是君子偷看就娶我

那年送女同学回家遇山洪,她脱光烤火命令:转头是君子偷看就娶我

云端小院
2025-11-14 09:01:52
全运会激烈战报:陈梦逆转王曼昱,孙颖莎憾负朱雨玲

全运会激烈战报:陈梦逆转王曼昱,孙颖莎憾负朱雨玲

7号观察室
2025-11-15 21:00:20
2025-11-16 04:35:00
中国企业家杂志 incentive-icons
中国企业家杂志
本账号由《中国企业家》杂志社有限责任公司运营
2821文章数 19840关注度
往期回顾 全部

财经要闻

小米之“惑”

头条要闻

大量日本民众围堵首相官邸 大喊:高市早苗下台

头条要闻

大量日本民众围堵首相官邸 大喊:高市早苗下台

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

科技要闻

撕掉流量外衣,小米还剩什么?

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

艺术
数码
健康
手机
公开课

艺术要闻

她的笔下女子如此动人,晚年却名声扫地!

数码要闻

华为Mate 80全系支持3D人脸识别,同期还有高端“二合一平板电脑”

血液科专家揭秘白血病七大误区

手机要闻

iPhone Air开启eSIM时代:国内厂商纷纷跟进

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版