Hi,周末早上好。
我是洛小山,和你聊聊 AI 思考。
最近团队里有件小事,让我特别高兴。我下属一个 3D 模型作品被腾讯投产了。
前段时间,腾讯办了个「生肖鹅 × 混元3D AI创作大赛」,我们团队的产品经理也去凑了个热闹。
提交了几个作品,结果名单公布,她成了唯一一位入围两个作品的选手。
两个作品长这样,一张叫《马上下班》,一张叫《马上变强》。
笑死,班味真的很重了。
两个玩梗的创意,通过AI 变成了能让上万人共鸣和投票的 3D 作品。
但说实话,这份高兴之下,我内心其实是有点意外的。
因为我对混元的印象,可能还比较刻板 & 停留在 2023 年。
那个时候我还没有从腾讯天美离职,内部测试混元的时候,坦白说,当时的感觉就是…emm,一般般吧。
可眼下,这个我曾经觉得一般般的团队,却在最近腹泻式开源,从LLM到VLM到 3D 大模型。
一个我印象中务实、甚至有些保守的公司,为什么突然变得如此激进?
这就很奇怪了,事出反常必有妖。
于是我花了一两周的时间,把混元这个最熟悉的陌生人调研了一遍。
今天,想把一些思考,与你一同分享。
01 | 一个跟随者的非对称战争
让我们回到“百模大战”的起点。
那是一个极其喧嚣的时候。
彼时 OpenAI 的 GPT 一骑绝尘,海外的 Claude、Gemini 紧追不舍,国内的文心一言、通义、豆包,以及国内新秀Kimi、智谱纷纷抢占山头的时候。
鹅呢,安静如鸡。
市场都盯鹅:你呢?
鹅:勿 Cue。
到2023年9月,混元大模型才匆匆上线,主打速度。
你先别说质量好不好,你就说快不快吧。
坦白说,测完之后,我觉得,这更像是一个「面向股东训练」的大模型。
很一般,非常一般,不如 ChatGLM 2。
所以,我觉得初代混元更多是「补齐生态」的定位。
那时候大家对混元的效果一言难尽。
接下来很长的时间,鹅又继续做了很长时间的 AI 小透明,往上腾讯出局的消息也很多。
到这里,故事本该是一个「起得不怎么早,所以赶了个晚集」的悲伤结局。
Pony 有一句金句:即使你什么错都没有,就错在你太老了。
这个时候,鹅的这个回旋镖,好像扎在了自己脑门上。
时间到了 2024 年底,等大家都对鹅失去兴趣的时候。
鹅,终于动手了。
鹅用 Hunyuan Large、HunyuanVideo 打响了开源第一枪。
这个时间点有些微妙,ChatGLM4、Minimax abab 6、Qwen 2.5 主宰国内 LLM API 市场,Kimi靠超长上下文封神,可图模型追赶 Sora,阿里 Qwen 成为开源生态王者…
应用层面,豆包已经 900W DAU,Kimi 300W DAU…
此时的 Qwen 已经开源了多种模型了,下图来自互联网博物馆。
那么,一个在所有关键战场都已落后的选手,即便你投入了这么大的研发成本,这个时候开源还有啥意义?
现在回过头来看… 答案还挺简单的。
鹅不得不开源,鹅不得不全面开源,鹅再不开源,就真的要落后了。
这个逻辑,和 LLaMa 暴力开源来限制 OpenAI 一家独大的阳谋如出一辙,鹅很明显也知道这一点。
目标就是:主动摧毁基础大模型本身的稀缺性价值。
当模型本身变得像空气和水一样廉价甚至免费时,竞争的主战场就不再是谁的模型更强那么一丢丢,而是三样东西:
1. 高质量、大规模、以及大量无法被爬取的私有数据;
2. 稳定、高效、能承载海量调用与高并发的云服务;
3. 极其牛逼的、触达数亿用户的分发渠道。
而这三样,正是是腾讯真正的护城河。
换言之,鹅在用自己的非核心资产(大模型),无差别打击对手核心资产(创业公司大模型收费模式),然后为自己真正的核心业务(云、数据、分发)引流。
这是一场用开源换时间窗口和未来生态位的战略豪赌。
那么,既然都是赌,赌什么就变得很关键。
我从鹅的公众号找到他们开源的矩阵,全面开源不同尺寸的 LLM 、VLM 都只是基操。
关键点在于下面这一堆翻译、3D、游戏、角色、音视频大模型。
这我有点看不懂了,如果只是为了给云服务引流,开源几个语言模型,或者直接接别家的开源模型就够了啊。
为什么腾讯要这么大投入搞 DiT 研究文生视频、图生视频、甚至是图生 3D 这些看似投入贼儿巨大、然后回报不明的领域?
02|内容帝国的阳谋
刚才说这是鹅的豪赌,赌啥?
在谈论它的焦虑要赌啥之前,我们先看 腾讯 2025 H1 财报,明确鹅的底牌。
这张最新的财报拆分图,答案已经写在脸上了。
即便在 AI 浪潮席卷一切的今天,腾讯的江山,依然是由两大基石牢牢撑起:
一是增值服务,其中游戏又是绝对的大头;
二是金融科技及企业服务。
这两块一共 1,469 亿,占据了公司收入的80%。
腾讯的整个商业版图,无论是游戏、音乐、影视,还是支撑这一切的社交和广告,本质上都是建立在对这些数字内容的生产和分发之上。
内容,既是腾讯的铠甲,也是它在 AI 时代必须拿下的新战场。
为什么这么说?
因为在没有 AIGC 过去,内容的生产资料,是昂贵且稀缺的。
比如天美 J3 这样顶级的游戏工作室,成百上千人的美术、建模和开发团队,动辄上亿的开发预算。
共同打造了像《三角洲行动》这样好玩的枪战游戏。
还有天美 N1 工作室,游戏 & 短剧共同打造了《盛世天下》这样好的游戏…
我这两天一直没写内容的时候,都在玩这游戏,疯狂送死…
虽然鹅有过硬的实力提供优质的内容,但 AIGC 时代来了之后,尤其是视频和 3D 内容的生成,更多人能快速产出优质的内容,在从根本上改变这一切。
它在把鹅昂贵的生产资料(比如牛逼设计师以及游戏资产),变得廉价、普惠。
虽然 AIGC 的能力还不那么强,但 AIGC 已经展现出了一个巨大的、全新的商业机会:一个围绕着“AI内容创作”的、价值万亿的开发者生态。
以前,好内容需要专业的设计师专业的培训,但在未来,无数中小开发者、独立工作室,甚至每一个有创意的个人,都有可能借助AI,成为新内容的生产者。
现阶段,我们都看到的是 Qwen 的全矩阵开源,海螺、即梦、可灵神仙打架…
推荐你看看数字生命卡兹克的推文,几乎每天都有新东西,很多应用的 SOTA 可能坚持不到一周就被超了。
讲真,这么多的 SOTA,我自己完全测不过来。
换言之,一个巨大的、全新的工具和平台的市场,正在基于 AI 诞生。
如果这个市场上所有的画笔、纸张和内容引擎,都由别人提供了,那腾讯作为内容之王,地位就会被逐渐架空。
这,才是内容帝国的远虑:
眼前的应用威胁都还好,鹅毕竟有流量,问题不大。
但未来的内容以及开发者生态的争夺才是关键。
所以鹅的动作,就是从专业的自己产生高质量内容消费平台,积极延伸到内容生产平台。
既然新的内容生态要形成,那我就必须要成为那个提供核心生产的工具的人。
理解这点之后,我就理解为什么鹅的开源矩阵几乎和 Qwen 持平,除了卷文生文之外,还卷开源 3D、音视频模型等等这些特别的适用于游戏场景的模型。
因为这些赛道,还没有被其他厂商太多染指,鹅还具备先发优势。
比如,图生 3D 在开源之后,直接拿下 Hugging Face 趋势榜 Top 10 里面的 4 席。
文生图榜单上拿下 Top2
还有很多差异化的模型,比如鹅为了面向多国语言本地化场景的翻译模型,我现在部署在了本地,结合沉浸式翻译库库用。
别的不想再夸了,不然看起来像我收了腾讯钱在写软文。
总结一下,在通用语言模型这个主战场上,鹅务实地保持跟随,不掉出牌桌,库库追赶,一些领域各有亮点。但在自己最擅长的战场:内容生态,大力投入,用开源换生态,用开源换标准定义权,用开源换开发者生态。
鹅在用自己内部海量的游戏、视频、社交资产,打磨这套 AIGC 的 Playground。
一旦成熟之后,就彻底直接开放,用生态优势来打差异化。
别的厂商要从这块追上去,就不单单是技术问题了,还有生态的迁移成本。
这种顶层设计,也从根本上解决了大公司最头疼的内耗问题。
如果你只是干个基模,哪个算法团队拉起来都能干,但当所有 AI 团队的不是随便搞个基模成为最强,有了清晰的「服务内容生态」这个共同北极星的时候。
鹅定完 OKR 之后,真的能很卷的,信我。
而这套已经开始运转的飞轮,也让资本市场的故事,有了新的讲法。
当然,这只是我基于个人对鹅的理解,结合公开信息后的分析。
腾讯内部真正的战略考量,肯定远比这复杂得多。
我也很好奇,如果你身在其中,你会怎样看待这场豪赌?欢迎在评论区聊聊。
03 | 你的护城河,还有用吗?
腾讯的腹泻式开源,是一场蓄谋已久的阳谋,是人无我有,人有我优,人优我也跟的策略。
用放弃模型知产的代价,换生态,加固自己内容、数据、云、分发等等大块疆土。
鹅在AI时代的焦虑,不担心自己的模型不够好,因为总能进步。
鹅最怕下一代内容的生产资料不再掌握在自己手里。
这套复杂的打法,归根结底也在回答一个我们所有企业、创业者、甚至所谓的超级个体…
在 AI 时代下都必须面对的问题:你们业务的护城河,还有用吗?
我们在创业、在做业务的时候,都在拼命地想深挖护城河,提高各种壁垒。
在古代,护城河是一条深邃的、环绕城池的河流。
有了它,敌人就难以攻到城墙之下。
腾讯过去有很多这样的「河」。
它庞大的研发团队、顶尖的游戏工作室、超级庞大的用户群,就是最深最宽的护城河。
但是,当现代敌人开着飞机来的时候,你这条河还有用吗?
AIGC,就是那架从天而降的飞机。
它让内容的生产方式,发生了维度级别的改变。
过去需要千军万马才能攻下的城池(比如做一款3A游戏),现在一个五人小团队,靠着 AI 这架轰炸机,就可能直接空降城里了。
到这个时候,你再把护城河挖深一米,又有什么意义呢?
这是我最近分析腾讯开源的思路之后,想明白的一点。
腾讯告诉我,在飞机战争的时代,真正的护城河早已不是城池边上的挖的那条河,而是你能不能也搞个机场飞起来。
混元腹泻式开源,就是和你说:来,我这有机场有飞机,你跟我的标准搞。
以后还能买买我的加油服务、保养服务啥的。
腾讯放弃了守卫那条正在被时代蒸发的河,通过差异化的定位,开源3D 赛道、视频赛道的大模型,试着从内容生产者转变成内容生产平台。
毕竟开发者是没有粘性的,谁家模型性价比更高就用谁的,用户也不那么在意,用户的目标是效果而不是过程。
但如果因为开源,你的创作流程、你的素材资产、你的分发渠道,都已经长在了这个「机场」的生态里,你的迁移成本就会变得无比巨大,毕竟开发者转化壁垒也是壁垒。
这给我们的启发是什么呢?
今天,我们也试试问问自己:
我们业务引以为傲的护城河,究竟是一面高墙,还是一张网,亦或者是一个池塘?
毕竟,在这个巨变的时代,最坚固的防御,早已不是挖深一条旧的护城河。
而是去建造一座新的机场。
时间关系,关于如何打造自己的「飞机场」,我们还有很多可以聊的。
那么,就用混元生成一个 3D 洛小山作为本文结束吧~
我是洛小山,我们下回聊。
往期思考 :
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.