网易首页 > 网易号 > 正文 申请入驻

MiniMax刘华:基础大模型公司将只剩个位数,十万卡是少数公司的追求

0
分享至

国内大模型创业公司已经走出六家独角兽,即便头部已清晰,关于创业公司哪家的路线更好、未来谁能留在牌桌上的讨论仍未停止。

12月初,第一财经记者在上海见到了MiniMax副总裁刘华,他给出的判断是,基础大模型赛道将会局限在个位数的企业,其中包括大厂和创业公司,除此之外,很多人要转去做AI应用。

MiniMax是六家独角兽之一。布局上看,如今已有独角兽舍弃做视频模型,有的在B端和C端应用间做出了选择,MiniMax则涉猎较广,布局了语言、视频大模型以及面向B端和C端的产品,其中包括海螺AI、Talkie及对应的国内版产品星野。

MiniMax此前较少面对媒体,在这次一个多小时的采访中,刘华谈到创业公司商业化的思路、对o1路线的判断和现下的行业格局,就算力需求变化,他和算力提供方腾讯云北区云原生总经理田丰都认为并非所有模型训练都需要10万卡集群。

“前提是比Meta的开源模型更好”

“国内AI产业总体上没有太多泡沫。”刘华告诉记者,此前之所以行业存在一些资源浪费,是因为太多企业认为自己能做基础大模型。泡沫撇去,更好的情况将是大家认识到能做基础模型的企业不多,更多人有志于做大模型应用。

近一年间,大模型的浪潮从文本涌向多模态,除了有能力多个领域同步出击的大厂,要不要做视频大模型、要聚焦哪类应用,六家独角兽需要量力而行,其中一些已做出选择。其中,月之暗面是聚焦C端应用的代表,智谱AI对B端应用相对侧重,百川智能已决定不跟进Sora视频大模型的路线。MiniMax则同时跨进文本和视频大模型领域,应用上布局C端和B端,其中C端产品进入超180个国家和地区。据AI产品榜数据,11月AI社交产品Talkie的全球月活跃用户量2519万,在全球榜单中排第9名。

刘华告诉记者,对创业公司而言,比较好的路线是把大模型做好,并做更多B端标准化产品,C端只做少量应用。做To B和To C产品是为了让大模型技术触达更多用户,通过用户反馈知道如何改进模型,盈利问题则还要慢慢看。公司会对产品做少量推广宣传,但目前单纯以扩大用户规模的投流价值不大,这种方式获得的用户黏性差,仅30天留存率就“没法看”。

应用变现上,刘华判断,中国市场的优势在于用户规模大,国内做C端产品最终要靠流量变现,广告是一种方式,海外C端用户的付费习惯比较好,付费会员也是合适的方式。

关于B端应用大模型定制更好还是标准化更好,业内目前则存在争论。有大模型定制化厂商负责人告诉记者,定制模型推理成本更低,客户也能完全控制并调整模型。刘华的判断则是,创业公司做B端产品较好的方式是标准化。

“国内做AI定制项目快的半年,慢的一年多,如果要花一年半时间做定制化项目,说不定我们的模型迭代两个版本就能满足(要求)了,那还不如花更多时间迭代模型。”刘华解释,至于客户对数据安全的疑虑,能通过与腾讯云开创云上专区的方式保证企业数据的安全,预计国内会有更多企业接受标准化调API(接口)的方式。

基于公司商业化以及获得大厂支持两种方式,刘华认为创业公司能留在大模型赛道内并继续迭代模型的可能性还是很大。

在做应用和做大模型之间,刘华还认为,大模型玩家要提供商业化服务并形成营收,意味着要为客户提供其他厂商提供不了的服务,特别是要与开源模型拉开差距。“比开源模型更好是一个最基本的门槛,如果基础大模型做不到这一点就可以不用玩了,可以转做AI应用了。在国内做商业化一个最基本的前提就是比现在Meta的Llama模型更好,否则别人可以用Llama,为什么花钱用你的模型?这很现实。”刘华表示。

“o系列的方向能降低模型错误率”

技术路径上,大模型业内也在迭代。北京时间周五凌晨,OpenAI推出了“满血版”推理模型o1,这款在今年9月以预览版上线的模型已在AI业界掀起波澜。国内多家大模型创业厂商纷纷表态,月之暗面创始人杨植麟称o1标志着AI范式迁移,百川智能创始人王小川认为标志着范式升级。不过,o1指出AI新路径的同时,并非所有大模型厂商都在改变自身的研发范式。

“o系列模型是一个能降低模型错误率,让大模型能被严肃的生产、研发、科研、设计领域应用的重要发展方向,这与我们降低模型错误率的目标相通。”刘华告诉记者,上一代GPT系列模型的一个问题是错误率偏高,在30%左右,而要进入这些严肃领域,错误率至少要降到2%~3%。

不过,刘华认为,o系列模型仅仅是开辟了一个方向,未来可能导向一些场景,例如大模型对一个问题思考几周、几个月,来解答人类社会的重大问题。而就MiniMax而言,公司不会受其他厂商的影响轻易调整发展模式或技术路线,除了降低错误率,公司研发方向还包括做多模态、确保大模型能以较低的输入输出成本处理复杂计算。

大模型厂商技术迭代的同时,算力方也在适应大模型提出的新要求。田华告诉记者,MiniMax早期用到几千卡集群,现在要大几千卡、上万卡,后续还会有更大规模的算力需求,这对算力提供方的组网、集群运维能力提出了高要求。以网络为例,万亿参数大模型下,训练通讯占比基本能达50%,传统的网络协议容易造成拥堵,导致训练效率下降。腾讯云为此优化了星脉网络,使之能支持10万卡超大规模训练集群。

海外厂商也在布局大规模算力集群。此前,特斯拉CEO马斯克旗下的AI公司xAI初步建成了具备10万张H100 GPU算力的超级AI训练集群 Colossus,当地时间12月5日,大孟菲斯商会表示,xAI计划将Colossus算力再扩大十倍。

从1万卡到10万卡集群,田华告诉记者,除了模型本身,更多还需解决集群的网络和运维问题,并不是所有的训练厂商都需要1万卡或10万卡规模,同一个模型用10万卡的效率也不一定就大于1万卡,这并非正向叠加的过程。

刘华则告诉记者,10万卡集群目前还是美国极少数企业的追求。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“同学妈妈把我儿子害成学渣”,家长使坏能有多离谱,长见识了

“同学妈妈把我儿子害成学渣”,家长使坏能有多离谱,长见识了

世界圈
2026-06-20 13:48:01
死亡之组大乱!日本 4-0 血洗对手,出线形势一夜之间全变了

死亡之组大乱!日本 4-0 血洗对手,出线形势一夜之间全变了

十点体坛
2026-06-22 21:44:48
够狠!中国公布日本袭扰辽宁号:战舰堵路,战机临门

够狠!中国公布日本袭扰辽宁号:战舰堵路,战机临门

阿龙聊军事
2026-06-22 19:06:44
鸭蛋再次成为关注对象!多名院士发现:常吃鸭蛋的人,有7个变化

鸭蛋再次成为关注对象!多名院士发现:常吃鸭蛋的人,有7个变化

医学科普汇
2026-06-19 19:05:10
日本警告特朗普后,不到48小时,逮捕多名美军人员,美国或被激怒

日本警告特朗普后,不到48小时,逮捕多名美军人员,美国或被激怒

坠入二次元的海洋
2026-06-23 04:25:48
婚外情中,女人大多有以下三个“心结”,很现实

婚外情中,女人大多有以下三个“心结”,很现实

叶飞飞情感屋
2026-06-22 19:57:36
尺度好大,后劲更大!

尺度好大,后劲更大!

吐槽电影院
2026-06-22 10:38:34
蜂蜜被点名!医生提醒:糖尿病患者常喝蜂蜜水很快迎来4个改变!

蜂蜜被点名!医生提醒:糖尿病患者常喝蜂蜜水很快迎来4个改变!

芹姐说生活
2026-05-20 23:42:03
深圳太温暖!网友发帖称失业不用去星巴克,党群服务中心承担所有

深圳太温暖!网友发帖称失业不用去星巴克,党群服务中心承担所有

火山詩话
2026-06-23 04:52:12
太解气!印度挖通13公里隧道举国狂欢,中国反手掏出600台盾构机

太解气!印度挖通13公里隧道举国狂欢,中国反手掏出600台盾构机

离离言几许
2026-06-18 12:12:17
52岁纳什现状如何?被炒后不工作,定居加州,享受足球,二婚恩爱

52岁纳什现状如何?被炒后不工作,定居加州,享受足球,二婚恩爱

大西体育
2026-06-22 07:03:17
沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

细说职场
2026-06-19 14:29:16
美伊达成协议文本,内塔尼亚胡支持率暴跌:超72%以色列民众不相信他说的话

美伊达成协议文本,内塔尼亚胡支持率暴跌:超72%以色列民众不相信他说的话

红星新闻
2026-06-22 14:59:31
广西一女神太漂亮 啦 身高170cm 体重56公斤 五官精致到无懈可击

广西一女神太漂亮 啦 身高170cm 体重56公斤 五官精致到无懈可击

喜欢历史的阿繁
2026-06-23 04:46:31
欲哭无泪啊!30岁后端开发被约谈:27K降薪20%还是走人,太难选择

欲哭无泪啊!30岁后端开发被约谈:27K降薪20%还是走人,太难选择

火山詩话
2026-06-22 14:50:19
现在的男女关系太乱,邻居是个三十岁的女人,经常带不同男人回家

现在的男女关系太乱,邻居是个三十岁的女人,经常带不同男人回家

千秋文化
2026-06-22 19:35:26
芯片刚需材料爆发!电子级氢氟酸7大核心龙头全维度拆解

芯片刚需材料爆发!电子级氢氟酸7大核心龙头全维度拆解

爱看剧的阿峰
2026-06-20 11:15:15
2-0,0-2!中国球员温网1胜1负:陈奕迅准女婿出局,小布送蛋过关

2-0,0-2!中国球员温网1胜1负:陈奕迅准女婿出局,小布送蛋过关

全景体育V
2026-06-22 20:24:10
中共中央批准:开除两虎党籍

中共中央批准:开除两虎党籍

上观新闻
2026-06-22 11:59:40
医生警告:夏天,糖尿病千万不能“碰”这4种水果,小心血糖飚升

医生警告:夏天,糖尿病千万不能“碰”这4种水果,小心血糖飚升

刘哥谈体育
2026-06-22 15:11:07
2026-06-23 06:32:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
256813文章数 622756关注度
往期回顾 全部

财经要闻

前美联储主席格林斯潘去世 享年100岁

头条要闻

阿根廷2-0奥地利 卫冕冠军2连胜提前晋级32强

头条要闻

阿根廷2-0奥地利 卫冕冠军2连胜提前晋级32强

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛,向佐揭内娱暗规则

科技要闻

马云与阿里巴巴众高管下田插秧

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

教育
艺术
家居
旅游
公开课

教育要闻

高考志愿填报临近,关于海南洛桑旅游大学,家长最关心的几个问题

艺术要闻

光设计就刷屏!南京“绿洲大厦”,层层像梯田!

家居要闻

绿意盎然 自然之境

旅游要闻

开屏消费观|端午假期,云南民宿预订量跻身全国前三

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版