网易首页 > 网易号 > 正文 申请入驻

抢夺资金、人才、用户 AI“六小虎”进入“破局时刻”|特写

0
分享至

编者按:DeepSeek的爆火不仅掀起技术狂欢,更将中国大模型创业圈推入价值重估的十字路口。当行业开始追问“为什么大模型六小虎没有成为DeepSeek”时,更深层的行业洗牌暗流已然涌动。
在这场价值重估多维度发酵之际,《科创板日报》将推出系列报道,追踪国内外基础大模型、AI应用创业及投资的发展和变化,力求还原一个真实、全面且充满活力的大模型行业全景,为读者带来深度、专业且富有前瞻性的行业洞察。

《科创板日报》2月16日讯(记者 陈美)一石激起千层浪。当DeepSeek 以迅猛之势搅乱 AI 江湖的原有格局之后,之前独领风骚的AI “六小虎” 正面临“破局”的关键时刻。

某央企技术负责人对《科创板日报》记者表示,“DeepSeek给业界指了“一条明路”:使用以GRPO为代表的强化学习,加上高质量Long CoT数据,理论上可令任意通用大模型显著提升其推理能力;在部分细分领域,哪怕1.5参数量的模型,经训练后也可打到媲美o1的效果,这使得大模型训练与推理的算力资源成本大大降低。”

最新消息显示,字节CEO梁汝波已反思Deepseek,称跟进速度不够,今年要追求智能上限。OpenAl首席执行官SamAltman也宣布GPT 4o升智,智力要达到o3 pro水平,并表示更新后的GPT 4o还是最好的AI搜索产品。

这意味着2025年大模型领域,将迎来一场全方位的竞争。然而,面对单次预训练300万美元的烧钱门槛、8位数年薪的人才争夺战、以及用户留存与投流成本的剪刀差,以及DeepSeek的搅局、大厂的追击,在资金储备、人才密度与用户增速的路上,AI“六小虎”亟需自行探明。

DeepSeek来了,Kimi首当其冲?

在DeepSeek崛起之前,AI“六小虎”在大模型领域崭露头角,吸引了大量资本注入。

财联社创投通数据显示,2024年AI“六小虎”融资火爆。其中,月之暗面先后完成超13亿美元融资,投后估值高达33亿美元,约220亿元;智谱同样表现亮眼,2024年完成三轮融资,累计融资额保守估计超40亿元,估值水平也跻身200亿元水平。

但高昂的训练成本,对于资金相对薄弱的AI “六小虎”而言,仍是巨大挑战;另一方面,为抢占用户心智的巨额投流,也让C端营销成本不断攀升。

一位投资人告诉《科创板日报》记者,由于月之暗面的Kimi与DeepSeek均涉及国内to C领域大语言模型,且在技术路径上,Kimi与DeepSeek完全不同。因此,在这波冲击中,Kimi尤为受到关注。

《科创板日报》记者了解到,在技术路线上,智谱、百川智能、零一万物、MiniMax、阶跃星辰,与DeepSeek一样,都采用了MoE(混合专家)模型,进行训练。

在C端产品对垒中,DeepSeek-R1模型发布的同一天,1月20日Kimi也发布了Kimi k1.5,并强调超长逻辑链能力,将强化学习的上下文窗口扩展到128k。

一位不愿具名的投资人向《科创板日报》记者分析,“128k是指模型‘窗口’的大小,虽然含义是12.8万个token,但考虑到输出性能,比如背后调用多少算力,且每家模型的token计费逻辑不同。在DeepSeek开源情况下,对应Kimi的投流,Kimi k1.5的总体成本应该高于DeepSeek。”

“此外,DeepSeek的‘思考’部分很长,在用户提出同样问题时,DeepSeek的输出长度可能是别人的好几倍。这也可能使得Kimi即便投流,依然陷入获客成本很高的境地。”

用户活跃度上,Kimi的C端领域标杆产品,月活已受到冲击。第三方榜单显示,1月份,豆包以7861万MAU位列大模型C端产品榜首;第二名则是DeepSeek,为3370万MAU;Kimi则位列第三,MAU为1943万。

或许正因如此,在原金沙江投资人、月之暗面联合创始人张予彤也做出发声。

近日,她在朋友中圈称,很高兴Kimi新版本上线后用户量又创新高:一是长文本+推理,让搜索问答更全面,及时、准确;二是多模态能力,文字+图像输入,让Kimi能看懂现实世界的复杂问题。

“创新基础模型架构”打响人才、资金之争

在各公司纷纷接入DeepSeek之时,对于大模型创业公司来说,逼迫“基础模型架构创新”的时刻已到来。

多位投资人告诉《科创板日报》记者,大模型的核心依然是技术创新。“这需要加大研发投入,探索多模态融合、强化学习等新技术路径,以提升模型性能和智能化水平。”

归根结底,这是一场“人才”的竞争。某产业机构投资人士表示,人才的价值,一是在于能及时调整和优化模型,寻找新的架构方向。此次字节这么快推出全新模型架构,依赖的也是人才的壁垒,让企业“跑得更快”;二是,面向应用端的有效落地,比如AI for Science、AI陪伴,AI视频等,顶尖人才的汇聚,能够在高价值领域快速构建价值产品,实现商业模式快速验证与直接创收。

字节得以迅速推出的稀疏架构,很大程度上也得以于它在AI人才上的积累。2024年,张一鸣已亲自下场挖人,包括原阿里通义千问大模型技术负责人周畅加入字节,年薪高达8位数。此外,零一万物原联合创始人和预训练负责人黄文灏也选择加入;智谱AI等公司中多名顶尖AI工程师和研究人员也被传已跳槽至字节。

引领当前行业风潮的DeepSeek,更是以擅于挖掘人才著称,并且仍在以百万年薪“招兵买马”**。而DeepSeek创始人梁文峰,本身也是浙大“学霸”,为“极致技术理想主义者”。

此外,传统大厂庞大的研发团队、海量数据资源,也让“六小虎”感到压力。“尤其是,大厂们不断推出AI新产品和服务的能力,以及在基础设施建设、产学研合作等方面优势明显,让行业竞争加剧。”上述产业机构投资人士认为。

与此同时,资金实力也是不下“牌桌”的关键一环。

李开复曾公开透露,一次预训练成本约三四百万美元,即便是成本更低的Yi-Lightning,在训练时也用了2000张GPU,耗时一个半月,花费三百多万美元。这意味着在大模型预训练上,烧钱是公认的事实。

在这方面,相较于“六小虎”而言,大厂、DeepSeek均实力雄厚。多位投资人表示,“由于有了成本比较,大模型创业公司的后续融资,或许与预期算力消耗有关”。

双重夹击下的“破局”时刻

DeepSeek、大厂的双重夹击,让AI “六小虎”不得不寻找“破局”之法。

零一万物已做出选择。在年初回应部分团队并入阿里的消息的采访中,李开复表示,去年5月发布Yi-Large模型时,团队已经意识到,模型在速度和性价比上存在不足,并在当时就决定放弃了原计划开发的超大杯模型Yi-X-Large。

随着进入B端市场,李开复认为,零一万物2025年的机会是挖掘 To B 大模型的PMF。

智谱CEO张鹏在回复《科创板日报》记者采访时称,“将All in AGI,其他的都是路径。而在路径上,智谱AI每天都在优化。”

MiniMax方面,1月15日,其已发布并开源新一代01系列模型,相比Kimi k1.5的12.8万个token,01系列模型支持最多400万个token的上下文输入;百川智能则专注于大模型在医疗领域的应用落地,近期其与国家儿童医学中心北京儿童医院签署战略合作协议,双方计划共同推出“一大四小”共5款AI医疗产品。

某央企技术负责人在接受《科创板日报》记者采访时表示,“DeepSeek的模型架构和训练模式,证明了大模型在推理过程中,可生成大量高质量训练数据,这再次印证了行业对‘合成数据’的价值共识,即构建的模型越被使用,高质量数据越多。”

“因此,谁拥有更多用户,谁就将拥有更多高质量的数据,实现‘左脚踩右脚’式的模型迭代。”该央企技术负责人称,也正是这种“自我强化”飞轮效应,使得DeepSeek实现了“正循环”,并以相对优势持续突破技术天花板。

在融资上,另有投资机构人士对《科创板日报》记者表示,面对DeepSeek技术、开源的优势,AI‘六小虎’亟需证明自己的产品,特别是“用户数”和“留存用户数”两个关键指标。如果没有规模增长用户留存数,其产品、技术、模型能力可能受到质疑,为后续融资埋下隐患。

另一产业机构投资人告诉《科创板日报》记者,大模型的“特色价值”是关键:“估值的下限是企业实力与影响力。对大模型企业而言,一定要从最基础、最本质的模型下手,提升模型效果,使得其在高价值场景的具有突出能力、牢固占据板块,拥有稳定的市场基本盘(即用户数),而这通常要求企业有强大的资金储备或融资能力,且与成本优化、人才队伍及企业愿景息息相关。”

“大模型公司估值的上限,则是企业服务的应用领域。大模型本身不是创收与壁垒的高地,只有聚焦高价值应用场景,比如医药领域AI For Science等,并在市场形成稳固的产品与业务壁垒,才是获取资本信任与长期价值的关键。”

在这方面,智谱、百川智能已在采取进一步行动,除了在自身业务上聚焦外,这两家公司还纷纷成立投资基金,以带动产业链上下游,以推进应用场景的落地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

懂球帝
2026-03-26 10:15:02
沙特国际电力和水务公司董事长预测中东局势将影响全球能源转型速度

沙特国际电力和水务公司董事长预测中东局势将影响全球能源转型速度

界面新闻
2026-03-26 16:51:04
伊朗重要人事任命,释放强烈信号!

伊朗重要人事任命,释放强烈信号!

斐君观点
2026-03-25 21:08:16
卡尔森:坏了!原来小丑不是特朗普,而是我自己

卡尔森:坏了!原来小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
航天少帅谭瑞松被判死缓 不执行死刑和终身监禁

航天少帅谭瑞松被判死缓 不执行死刑和终身监禁

小鹿姐姐情感说
2026-03-26 02:23:54
张雪峰离世的警示:人一定要学会避谶

张雪峰离世的警示:人一定要学会避谶

代伟看世界
2026-03-26 15:21:09
人老了,搞垮自己最快的方式就是:胡思乱想、过度操心、情绪失控

人老了,搞垮自己最快的方式就是:胡思乱想、过度操心、情绪失控

风起见你
2026-03-16 11:07:25
第81轮反击来了!飞弹直击以军集结地

第81轮反击来了!飞弹直击以军集结地

星火聊天下
2026-03-26 07:27:33
丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

丧心病狂!河南14岁少年被虐死案:死时穿纸尿裤,胃里空无一物

春日在捕月
2026-03-25 01:00:23
2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

复转这些年
2026-03-26 09:26:17
贾国龙焖面生意其实很好,粉丝:40一碗面嫌贵趁早滚出北京

贾国龙焖面生意其实很好,粉丝:40一碗面嫌贵趁早滚出北京

映射生活的身影
2026-03-26 17:11:14
李幼平同志逝世

李幼平同志逝世

澎湃新闻
2026-03-26 18:05:03
奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

奴颜媚骨具象化,高市早苗三十年前照片被扒出,原来她从未变过!

社会酱
2026-03-23 17:34:19
曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

曝张雪峰倒下30分钟后才被发现,饮食习惯糟糕,一口气吃8根雪糕

古希腊掌管松饼的神
2026-03-25 11:08:46
年入850万儿子生病转账15万,梁靖崑复婚协议揭开国乒真相

年入850万儿子生病转账15万,梁靖崑复婚协议揭开国乒真相

科学发掘
2026-03-26 16:14:56
怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

怀孕传闻真相大白后,翁帆突传“喜讯”,杨振宁终于可以放心了!

丁丁鲤史纪
2026-03-25 16:35:13
A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

夜深爱杂谈
2026-03-26 20:09:32
家长违停孩子开门杀撞人后逃逸?交警回应

家长违停孩子开门杀撞人后逃逸?交警回应

中国新闻周刊
2026-03-26 14:46:51
跌光2500亿!泡泡玛特,股价崩塌

跌光2500亿!泡泡玛特,股价崩塌

财经锐眼
2026-03-26 18:54:18
14亿人集体买房,为什么最后买出了一个烂摊子?

14亿人集体买房,为什么最后买出了一个烂摊子?

流苏晚晴
2026-03-25 18:14:02
2026-03-26 22:15:00
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
700137文章数 1019196关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
本地
游戏
数码
公开课

旅游要闻

别再人挤人,泰州的这条老街,传承1200年!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

开冲!PS会员4月离库名单公布:独立神作进入倒计时

数码要闻

iQOO Z11x发布:LCD党的护眼神机 1499元起

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版