网易首页 > 网易号 > 正文 申请入驻

开源与闭源,有限与无限的游戏

0
分享至

技术的伟大不在于它被谁拥有,而在于它如何被使用。

——Linux之父Linus Torvalds

01

把开源和闭源对立,很幼稚

随着百度在6月30日正式开源文心4.5系列的模型,一场关于大模型开源和闭源的讨论再次开始。

值得一提的是,百度这次的开源是“真开源”,体现在开源模型数量多、技术水平高。

从数量上来说,百度正式开源的文心大模型4.5系列模型,涵盖了47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型。

非常值得关注的是,这次开源实现了预训练权重和推理代码的完全开源,也就是说,开发者不但会知道百度在做什么,还知道怎么做。

这是诸多开源形式中最彻底、最充分的一种形式,足见百度对这个版本开源的决心之大、期望之高。

同样需要提及的是,文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。

图:文心大模型4.5系列开源模型

有飞桨和无飞桨,效果两个样,这个话题我们日后再谈。

有趣的是,围绕百度开源,业内开始再次辩论开源和闭源的优越性。

事实上,把开源和闭源看作是完全对立的,很幼稚。

而之所以会产生这种幼稚的看法,是因为一个长期以来的刻板印象——开源就是免费,闭源就是收费;开源就是做奉献,闭源就是为了牟取暴利。

事实上,开源和闭源只是一种阶段性的战略选择,这个我们稍后细讲。

先说的绝对一点,这世界上从来没有只有开源模式或只有闭源模式的头部AI公司。

例如,Meta 开源的 Llama 2 在社区贡献下,推理速度提升了 47%,这是一个世界级的标志性现象,也是很多开源支持者津津乐道的一个案例。因为,很多开源支持者认为,能够取得这样的成绩,核心原因是开源开发者通过社区协作,集合全球开发者的智慧,从而显著提升了模型迭代速度。

但是,Meta所谓的开源并不是无保留的。事实上,开源的Llama系列依然保留了核心算法。同时,其一方面以开源姿态,通过生态合作(如Hugging Face)扩大影响力;同时,仍有部分闭源模型针对用于商业化,如Meta AI企业服务。

再看一个例子,今年2月,Grok3正式发布,这款被马斯克宣称为“地球上最聪明的AI”,引起了广泛关注。

然而,马斯克并未如外界所猜测那样,当场宣布开源。

众所周知,AI大模型业界,马斯克被认为是开源的最核心支持者之一,尤其是在openAI转向闭源之后,马斯克甚至发起过诉讼。

但从马斯克及其xAI的真实产品布局看,马斯克并未如外界所设想的一样,走“全开源”路线。实际上,准确的描述是,马斯克只是宣布将在后续对上一代大模型即Grok2进行开源,最新的Grok3 则仍然走了闭源路线。

某种程度上,模型开源+保留核心算法,或模型开源但绑定收费云服务,才是业内通行的做法。

客观来讲,这种做法有助于在维护市场普及率,保持技术领先性和加强商业竞争力等三个需要兼顾的要素之间取得平衡——也就是通过对非最新一代(或即将迭代)的模型进行开源,以实现扩大用户基础、收集多样化数据,从而推动AI模型的持续迭代的目的;另一方面,对于最新的或高端的模型,通过直接或间接的方式来收费或与收费服务绑定,来平衡成本。

毕竟,大模型是一种非常昂贵的造物,其训练过程中需要的海量算力和数据集客观上需要大量的集中式投入,如果没有一种相对平衡的成本回收机制,任何一家财雄势大的AI公司都无法持续的提供开源,这是一个典型的“鸡生蛋还是蛋生鸡”的悖论。

所以,你说这种主流做法,到底算是开源,还是闭源?

所以我造了一个词,叫“混合开闭源”模式,这其实才是真正的主流AI公司的常态。

如果把眼界再开阔一点,我们还可以进一步得出一个结论——成熟的软件企业,很大程度上是开源和闭源双轨制的。

微软可以是说历史上最坚持闭源,甚至是对开源深恶痛绝的企业,其来自Windows和Office的滚滚财富,正是基于闭源的基础之上。其前首席执行官鲍尔默甚至抱怨称开源的Linux“就像是癌症病毒”。

但曾经抵触,不表示永久抵触。事实上,意识到软件行业的结构发生深层次变化后,微软于2018年以75亿美元的巨资收购GitHub,后者作为全球最大的开源代码托管平台,拥有超过2800万开发者用户和1.2亿代码仓库,是开发者社区的核心枢纽,也可以说是微软“死对头”的聚集地。

微软买下了曾经被它称为“癌症病毒”的开源社区,是因为后者能够有效的服务于微软的长期策略。

在鲍尔默执掌微软的后期,这家企业其实已经意识到,售卖操作系统和办公软件已经是上一个时代的核心商业模式,微软正在云计算时代掉队。

而购买GitHub后,则意味着其最突出的优势——代码托管功能,可以与微软的Azure云服务深度整合。说的更具体一点,无论开发者通过GitHub上要部署什么应用,也无论其开源或闭源属性,微软的Azure都将是默认的首选。

从此,微软成为GitHub的最大开源贡献者之一,并通过GitHub支持了大量开源项目(如.NET框架、VS Code等),进而重塑了上个世纪以来积累深重的“创新破坏者”的负面企业形象,进而吸引了大量开发者群体,客观上成为了开源时代最重要的“卖水人”之一。

这个例子有力的说明了,单纯的用支持开源或不支持开源来判断一个企业的战略是不准确的,成功的企业必然会将两者的优势集中起来,在不同的场景和商业模型下使用。

02

有限与无限

如果上一章我们是在一个非常宏观的层面论述了在一个企业体系内必然会兼容开源和闭源这两种形态,那么接下来要讨论的则是,大模型企业会在什么样的具体情况下选择开源或闭源?

基本的答案是,企业会根据具体的赛道场景和竞争需求来加以灵活的选择。

纽约大学宗教历史学教授詹姆斯·卡斯在著名的哲学思维著作《有限与无限的游戏》提供了一个认知世界的新观点,他将世界比作“游戏”,并区分为有限游戏和无限游戏。有限游戏以取胜为目的,无限游戏以延续游戏为目的。

或许我们可以打一个这样的比喻——有限游戏就好比短跑,需要在有限的时间内释放出最大的爆发力;而无限游戏就好比马拉松,比拼的是如何在一个漫长的竞争过程中熬过重重难关并最终取胜。

所以,聪明的公司在面对需要短期内制胜(效率导向)的时候,会选择有限游戏模式;在面对长期性的目标或长尾型的目标(终局模式)时,则采取无限游戏模式。

闭源是典型的有限模式,它通常在目标明确的时候被采用。例如,文心 4.0推出后,面临的紧迫任务是尽快的降低推理成本,这时候集中优质资源打硬仗的“有限游戏”就成为了好的战略选择。事实也是如此,通过集中优化和连续压强式的工作,百度快速把这一版本的推理成本降到最初的1%,并明显提升了性能。这种情况下,显然必须依靠闭源模式来集中兵力打硬仗。

然而,这次开源文心4.5的历史背景已经发生了很大的变化,这一版本被寄托的任务是加强渗透率和下载量,提高整个文心模型的普及率。这是一个非常长周期、长尾型的任务,在这种背景下,百度就自然会倾向于无限模式,这也是这次开源的深层次原因。

事实上,这样根据任务的不同属性来灵活决定某一个版本的开源属性的方式,已经成为AI特别是大模型领域的主流。

以开源著称的通义千问系列为例,其中7B、14B、72B等中小规模模型已开源,魔搭社区里更是提供了成百上千的版本供开发者自由下载和二次开发。

但与此同时,300B等大规模模型(如通义千问Max、Qwen3-235B-A22B等)则作为企业级云服务产品,因为其特性是通过API或私有化部署提供给企业客户,而且能够用到这种强大模型的机构,对私有化部署中的安全性、定制化和高性能都非常敏感,所以一定会选择闭源模式。

图:文心多模态后训练模型(支持思考、关闭思考)

在多个多模态基准测试中达到SOTA水平

与之类似的还有如谷歌开源了Gemini 2B/7B模型以对抗Meta,这是一场长期竞争,所以选择了开源模式;但对于数据、安全诉求都处于高敏感区间的如医疗、自动驾驶等领域,谷歌则提供了最高层次的闭源Gemini Ultra模型。

当然,商业诉求仅仅是企业选择开闭源的决策要素之一而非全部,更长久影响某个模型开闭源的主要因素,来自于其要完成的利益使命。

从对模型充分发展的意义上来讲,开源的优势非常明显,它可以集中智慧,显著降低参与门槛,吸引大量开发者、尝试者,从某种程度上提高某一系列模型整体上的“市场占有率”,DeepSeek R1就是最好的例子;但开源也有重要缺点,就是其贡献没有强制机制,导致其稳定性欠佳。

例如,有研究者就指出,开源代码的贡献者并不都是想象中那么“无私”——仍以GitHub为例,其社区中几乎每天都有开源项目因缺乏持续维护而被淘汰,而被淘汰的原因并非技术上的难以为继,而是因为开发者凭借已经开发的版本拿到了巨头的收购offer,进而停止了对开源项目的维护。

这个例子非常生动的告诉我们,不用也没有必要把开源或闭源的选择过于理想化,甚至提升到情怀层面。在真实世界里,无论是大企业还是个人开发者,其选择开闭源的主要理由都是由现实的利益和竞争的需求所决定的。

03

百度4.5开源,打开了一个新时代

百度断然决定把4.5版本在6月30日开源,是一个重要且敏捷的决定。

几个月前,DeepSeek的发布,的确让国内的AI领域有一种瞬间“万马齐喑”的感觉,特别是多年重度投入AI的大厂们更是受到了重重追问。

带着文心4.5 Turbo和文心X1 Turbo这两个具有很强竞争优势的新模型回归,百度用这种方式表达了自己的生存哲学——不但要跟进,还要打到终局模式。

客观来讲,DeepSeek的开源(尽管其也有闭源版本),对公众而言,是在开源和闭源的天秤上,在“开源”这一侧放下了一颗重重的砝码。

可以说,从这一刻开始,大模型竞争从单纯的对比参数、打榜、发论文,变成了真刀真枪的PK自家模型的行业渗透率和普及率。

我曾经写过,百度AI的生存哲学,核心就是竞争与创新。你也可以理解为,百度视AI核心业务的发展为一个非常长期的竞争过程,而技术创新是其生存竞争优势得以存在的重要保证。

既需要拉升渗透率,又需要持续的投入一场创新和竞争的马拉松,显而易见,这是一场“无限游戏”,所以百度毅然选择了开源模式。而且笔者甚至还猜测,在未来,对若干具有市场竞争力的大版本持续开源,或将成为百度的一种新的模式。

之所以产生这样的结果,最大的时代背景是——大模型已经从“尝新期”进入成熟期,已经从“炫技”变成“应用为王”,目前各大势力的核心目标都已经不再是飙指标,而是希望迅速进入千行百业的实际应用场景中,通过占据场景来“分蛋糕”。这种情况下,开源部分具有明显优势的核心版本,是最有效、最及时的办法。

百度本身就是国内罕有的四层架构俱全的全栈型AI公司,加之其拥有被成为“大模型的操作系统”的深度学习框架飞桨,这都让百度有了维持一场长期的,同时既比拼模型性能也比拼生态厚度的竞争的前提条件,这也是4.5版本开源的另一个宏观战略背景。

更具体的说,一方面,文心4.5的开源,以其优异的性能,显然能够吸引更多开发者参与到这一版模型的优化与创新中来,从而汇聚各方智慧,加速模型性能的提升。

而另一方面,大模型的应用普及期已经开启,通过开源,百度可以与上下游企业、科研机构以及广大开发者建立更紧密的合作关系,共同探索大模型在更多领域的应用,推动整个行业的发展,从而切下更大的一块“蛋糕”。

而除了以上的宏观意义之外,从微观层面来看,百度此次开源,也将带来更强的商业化效率。例如,一方面坚持开源基础模型(文心4.5)吸引用户,另一方面,通过千帆平台企业版(MaaS服务),以及重点行业的私有化部署、定制化需求等实现高端盈利。

结语

百战归来,仍是少年

作为一个长期跟踪百度AI战略的行业研究者,我当然难以忘却百度在前几年对闭源模式的偏爱,以及其背后的原因,如认为闭源模式更有效率等等。

所以,我也一度认为,百度虽然必然会在某个时刻、某个版本上转向开源,但“偶像包袱”和“面子问题”,都会引发争议和困惑。

但是没想到,说转就转了,可谓快速决策,灵活转身。

我为百度的干脆感到高兴,从更深层次来说,这不仅说明了百度求真务实、洞察时代潮流变化的战略洞察力,也说明百度及其领导者身上仍然具有创业企业的灵活性和活力,对于一家创立了25年的公司来说,能保留这种初心和活力,本身就是一种竞争力。

或许,此前百度的追求中,除了发展AI技术创新以外,也有对自己是行业领头羊的内心骄傲。但现在看来,百度的追求变得更加务实和接地气——在认定“应用”是目前的头等大事后,百度可以说方方面面的努力都是服务于“应用”。但这种“服务”的本质,是苦心经营自己的底层核心竞争力、提升自家基础大模型的核心能力和成本优势后,对行业能够更好、更便宜的去应用AI资源的一种最好的支持。

而这种努力的具象,就是眼前的这次开源;我认为这次开源是百度的一道关口,过了这道关,百度会放下很多历史包袱,会以更加灵活和充满活力的姿态,参与AI赛道的长跑,去争取无尽游戏的终局胜利。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈永贵副手郭凤莲的现状:儿子都是亿万富翁,大儿子掏3000万修庙

陈永贵副手郭凤莲的现状:儿子都是亿万富翁,大儿子掏3000万修庙

兵鉴史
2026-03-07 02:19:39
一堆人不知道!iPhone内置防晕车神器:网友实测超强大

一堆人不知道!iPhone内置防晕车神器:网友实测超强大

快科技
2026-03-08 18:15:04
中国游泳队重制荣誉墙:五朵金花上榜惹争议,多位世界冠军被撤下

中国游泳队重制荣誉墙:五朵金花上榜惹争议,多位世界冠军被撤下

篮球看比赛
2026-03-11 11:39:16
“中国警告全球航运巨头,表达严重关切”

“中国警告全球航运巨头,表达严重关切”

观察者网
2026-03-11 13:39:04
自曝患产后焦虑3月后,何穗再谈当妈妈的心酸,担心的事恐要发生

自曝患产后焦虑3月后,何穗再谈当妈妈的心酸,担心的事恐要发生

一娱三分地
2026-03-11 13:08:46
油价刚涨超5.6毛/升后,新周期又涨近0.9元/升,下次3月23日调整

油价刚涨超5.6毛/升后,新周期又涨近0.9元/升,下次3月23日调整

猪友巴巴
2026-03-11 14:40:04
1亿黄金运到美国,委内瑞拉高层开始吃香喝辣,没人管马杜罗死活

1亿黄金运到美国,委内瑞拉高层开始吃香喝辣,没人管马杜罗死活

老羴学科普
2026-03-11 13:50:31
梁山上唯一没有朋友的好汉:无人与他玩,就算生病到死都没人问津

梁山上唯一没有朋友的好汉:无人与他玩,就算生病到死都没人问津

铭记历史呀
2026-03-08 14:05:52
小杨生煎北京首店将开业,网友晒围挡照片!就在合生汇…

小杨生煎北京首店将开业,网友晒围挡照片!就在合生汇…

北京商报
2026-03-10 14:15:26
她是体坛冠军中的“败类”,为捞钱共侍二夫,坑了44亿逃到美国

她是体坛冠军中的“败类”,为捞钱共侍二夫,坑了44亿逃到美国

削桐作琴
2026-03-02 15:10:50
拒逆转!文班39+11平纪录,塔图姆24+5福克斯爆发,布朗暴怒驱逐

拒逆转!文班39+11平纪录,塔图姆24+5福克斯爆发,布朗暴怒驱逐

鱼崖大话篮球
2026-03-11 10:50:22
刘强东老婆章泽天在米兰看秀,扎辫子戴金耳饰,在老外堆里好出众

刘强东老婆章泽天在米兰看秀,扎辫子戴金耳饰,在老外堆里好出众

大铁猫娱乐
2026-03-09 14:40:03
特朗普突然“想谈判”背后:反导系统转往中东,说法一变再变

特朗普突然“想谈判”背后:反导系统转往中东,说法一变再变

南方都市报
2026-03-11 12:11:09
仅买10天的哈弗大狗新车高速上突发变速箱故障,4S店与厂家检测结果却不一致,车主:万一被追尾,后果真的不敢想

仅买10天的哈弗大狗新车高速上突发变速箱故障,4S店与厂家检测结果却不一致,车主:万一被追尾,后果真的不敢想

大风新闻
2026-03-10 15:10:11
新鲜出炉!2026金球奖排名更新,大英双星进前五,18岁帝星排第一

新鲜出炉!2026金球奖排名更新,大英双星进前五,18岁帝星排第一

篮球圈里的那些事
2026-03-10 20:23:10
台湾黄征辉:台湾可以和平回归,但大陆要答应2个条件!

台湾黄征辉:台湾可以和平回归,但大陆要答应2个条件!

混沌录
2026-03-10 21:18:10
未来10年,真正的“铁饭碗”来了!这8个行业,只涨不跌!

未来10年,真正的“铁饭碗”来了!这8个行业,只涨不跌!

老特有话说
2026-03-08 15:31:39
访华行程大幅缩水,仅到中国一个城市,特朗普清楚他对华没牌可打

访华行程大幅缩水,仅到中国一个城市,特朗普清楚他对华没牌可打

蓝色海边
2026-03-11 08:53:18
立陶宛豁出去了,为了向中国展现诚意,一下子跳到美国的火车前!

立陶宛豁出去了,为了向中国展现诚意,一下子跳到美国的火车前!

诗酒趁的年华
2026-02-14 10:24:06
马斯克惊叹,首个赛博果蝇活了!多行为大脑完整上传,自主驱动数字躯壳

马斯克惊叹,首个赛博果蝇活了!多行为大脑完整上传,自主驱动数字躯壳

新智元
2026-03-09 13:18:27
2026-03-11 16:55:00
胡说成理 incentive-icons
胡说成理
一个记录胡喆和他的朋友们,关于智能时代和智能时代的生意逻辑的小天地。
201文章数 28关注度
往期回顾 全部

科技要闻

腾讯急了急了,微信绝密AI智能体首度曝光

头条要闻

博纳影业于冬被澳门永利追讨473万港元 起诉书披露

头条要闻

博纳影业于冬被澳门永利追讨473万港元 起诉书披露

体育要闻

郭艾伦重伤,CBA下半赛季还能期待些什么

娱乐要闻

杨幂连续五年为刘诗诗庆生,刘诗诗回应

财经要闻

油价大转头?一天,从末日到曙光!

汽车要闻

莲花纠偏, 冯擎峰的“收”与“守”

态度原创

家居
游戏
旅游
本地
公开课

家居要闻

中式风格 人间朝与暮

男有彦祖女有亦菲?曝《三角洲》将联动刘亦菲

旅游要闻

“税动力”激活云南入境游发展新引擎

本地新闻

这档韩国玄学综艺,让多少人看得头皮发麻

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版