网易首页 > 网易号 > 正文 申请入驻

开源与闭源,有限与无限的游戏

0
分享至

技术的伟大不在于它被谁拥有,而在于它如何被使用。

——Linux之父Linus Torvalds

01

把开源和闭源对立,很幼稚

随着百度在6月30日正式开源文心4.5系列的模型,一场关于大模型开源和闭源的讨论再次开始。

值得一提的是,百度这次的开源是“真开源”,体现在开源模型数量多、技术水平高。

从数量上来说,百度正式开源的文心大模型4.5系列模型,涵盖了47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型。

非常值得关注的是,这次开源实现了预训练权重和推理代码的完全开源,也就是说,开发者不但会知道百度在做什么,还知道怎么做。

这是诸多开源形式中最彻底、最充分的一种形式,足见百度对这个版本开源的决心之大、期望之高。

同样需要提及的是,文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。



图:文心大模型4.5系列开源模型

有飞桨和无飞桨,效果两个样,这个话题我们日后再谈。

有趣的是,围绕百度开源,业内开始再次辩论开源和闭源的优越性。

事实上,把开源和闭源看作是完全对立的,很幼稚。

而之所以会产生这种幼稚的看法,是因为一个长期以来的刻板印象——开源就是免费,闭源就是收费;开源就是做奉献,闭源就是为了牟取暴利。

事实上,开源和闭源只是一种阶段性的战略选择,这个我们稍后细讲。

先说的绝对一点,这世界上从来没有只有开源模式或只有闭源模式的头部AI公司。

例如,Meta 开源的 Llama 2 在社区贡献下,推理速度提升了 47%,这是一个世界级的标志性现象,也是很多开源支持者津津乐道的一个案例。因为,很多开源支持者认为,能够取得这样的成绩,核心原因是开源开发者通过社区协作,集合全球开发者的智慧,从而显著提升了模型迭代速度。

但是,Meta所谓的开源并不是无保留的。事实上,开源的Llama系列依然保留了核心算法。同时,其一方面以开源姿态,通过生态合作(如Hugging Face)扩大影响力;同时,仍有部分闭源模型针对用于商业化,如Meta AI企业服务。

再看一个例子,今年2月,Grok3正式发布,这款被马斯克宣称为“地球上最聪明的AI”,引起了广泛关注。

然而,马斯克并未如外界所猜测那样,当场宣布开源。

众所周知,AI大模型业界,马斯克被认为是开源的最核心支持者之一,尤其是在openAI转向闭源之后,马斯克甚至发起过诉讼。

但从马斯克及其xAI的真实产品布局看,马斯克并未如外界所设想的一样,走“全开源”路线。实际上,准确的描述是,马斯克只是宣布将在后续对上一代大模型即Grok2进行开源,最新的Grok3 则仍然走了闭源路线。

某种程度上,模型开源+保留核心算法,或模型开源但绑定收费云服务,才是业内通行的做法。

客观来讲,这种做法有助于在维护市场普及率,保持技术领先性和加强商业竞争力等三个需要兼顾的要素之间取得平衡——也就是通过对非最新一代(或即将迭代)的模型进行开源,以实现扩大用户基础、收集多样化数据,从而推动AI模型的持续迭代的目的;另一方面,对于最新的或高端的模型,通过直接或间接的方式来收费或与收费服务绑定,来平衡成本。

毕竟,大模型是一种非常昂贵的造物,其训练过程中需要的海量算力和数据集客观上需要大量的集中式投入,如果没有一种相对平衡的成本回收机制,任何一家财雄势大的AI公司都无法持续的提供开源,这是一个典型的“鸡生蛋还是蛋生鸡”的悖论。

所以,你说这种主流做法,到底算是开源,还是闭源?

所以我造了一个词,叫“混合开闭源”模式,这其实才是真正的主流AI公司的常态。

如果把眼界再开阔一点,我们还可以进一步得出一个结论——成熟的软件企业,很大程度上是开源和闭源双轨制的。

微软可以是说历史上最坚持闭源,甚至是对开源深恶痛绝的企业,其来自Windows和Office的滚滚财富,正是基于闭源的基础之上。其前首席执行官鲍尔默甚至抱怨称开源的Linux“就像是癌症病毒”。

但曾经抵触,不表示永久抵触。事实上,意识到软件行业的结构发生深层次变化后,微软于2018年以75亿美元的巨资收购GitHub,后者作为全球最大的开源代码托管平台,拥有超过2800万开发者用户和1.2亿代码仓库,是开发者社区的核心枢纽,也可以说是微软“死对头”的聚集地。

微软买下了曾经被它称为“癌症病毒”的开源社区,是因为后者能够有效的服务于微软的长期策略。

在鲍尔默执掌微软的后期,这家企业其实已经意识到,售卖操作系统和办公软件已经是上一个时代的核心商业模式,微软正在云计算时代掉队。

而购买GitHub后,则意味着其最突出的优势——代码托管功能,可以与微软的Azure云服务深度整合。说的更具体一点,无论开发者通过GitHub上要部署什么应用,也无论其开源或闭源属性,微软的Azure都将是默认的首选。

从此,微软成为GitHub的最大开源贡献者之一,并通过GitHub支持了大量开源项目(如.NET框架、VS Code等),进而重塑了上个世纪以来积累深重的“创新破坏者”的负面企业形象,进而吸引了大量开发者群体,客观上成为了开源时代最重要的“卖水人”之一。

这个例子有力的说明了,单纯的用支持开源或不支持开源来判断一个企业的战略是不准确的,成功的企业必然会将两者的优势集中起来,在不同的场景和商业模型下使用。

02

有限与无限

如果上一章我们是在一个非常宏观的层面论述了在一个企业体系内必然会兼容开源和闭源这两种形态,那么接下来要讨论的则是,大模型企业会在什么样的具体情况下选择开源或闭源?

基本的答案是,企业会根据具体的赛道场景和竞争需求来加以灵活的选择。

纽约大学宗教历史学教授詹姆斯·卡斯在著名的哲学思维著作《有限与无限的游戏》提供了一个认知世界的新观点,他将世界比作“游戏”,并区分为有限游戏和无限游戏。有限游戏以取胜为目的,无限游戏以延续游戏为目的。

或许我们可以打一个这样的比喻——有限游戏就好比短跑,需要在有限的时间内释放出最大的爆发力;而无限游戏就好比马拉松,比拼的是如何在一个漫长的竞争过程中熬过重重难关并最终取胜。

所以,聪明的公司在面对需要短期内制胜(效率导向)的时候,会选择有限游戏模式;在面对长期性的目标或长尾型的目标(终局模式)时,则采取无限游戏模式。

闭源是典型的有限模式,它通常在目标明确的时候被采用。例如,文心 4.0推出后,面临的紧迫任务是尽快的降低推理成本,这时候集中优质资源打硬仗的“有限游戏”就成为了好的战略选择。事实也是如此,通过集中优化和连续压强式的工作,百度快速把这一版本的推理成本降到最初的1%,并明显提升了性能。这种情况下,显然必须依靠闭源模式来集中兵力打硬仗。

然而,这次开源文心4.5的历史背景已经发生了很大的变化,这一版本被寄托的任务是加强渗透率和下载量,提高整个文心模型的普及率。这是一个非常长周期、长尾型的任务,在这种背景下,百度就自然会倾向于无限模式,这也是这次开源的深层次原因。

事实上,这样根据任务的不同属性来灵活决定某一个版本的开源属性的方式,已经成为AI特别是大模型领域的主流。

以开源著称的通义千问系列为例,其中7B、14B、72B等中小规模模型已开源,魔搭社区里更是提供了成百上千的版本供开发者自由下载和二次开发。

但与此同时,300B等大规模模型(如通义千问Max、Qwen3-235B-A22B等)则作为企业级云服务产品,因为其特性是通过API或私有化部署提供给企业客户,而且能够用到这种强大模型的机构,对私有化部署中的安全性、定制化和高性能都非常敏感,所以一定会选择闭源模式。





图:文心多模态后训练模型(支持思考、关闭思考)

在多个多模态基准测试中达到SOTA水平

与之类似的还有如谷歌开源了Gemini 2B/7B模型以对抗Meta,这是一场长期竞争,所以选择了开源模式;但对于数据、安全诉求都处于高敏感区间的如医疗、自动驾驶等领域,谷歌则提供了最高层次的闭源Gemini Ultra模型。

当然,商业诉求仅仅是企业选择开闭源的决策要素之一而非全部,更长久影响某个模型开闭源的主要因素,来自于其要完成的利益使命。

从对模型充分发展的意义上来讲,开源的优势非常明显,它可以集中智慧,显著降低参与门槛,吸引大量开发者、尝试者,从某种程度上提高某一系列模型整体上的“市场占有率”,DeepSeek R1就是最好的例子;但开源也有重要缺点,就是其贡献没有强制机制,导致其稳定性欠佳。

例如,有研究者就指出,开源代码的贡献者并不都是想象中那么“无私”——仍以GitHub为例,其社区中几乎每天都有开源项目因缺乏持续维护而被淘汰,而被淘汰的原因并非技术上的难以为继,而是因为开发者凭借已经开发的版本拿到了巨头的收购offer,进而停止了对开源项目的维护。

这个例子非常生动的告诉我们,不用也没有必要把开源或闭源的选择过于理想化,甚至提升到情怀层面。在真实世界里,无论是大企业还是个人开发者,其选择开闭源的主要理由都是由现实的利益和竞争的需求所决定的。

03

百度4.5开源,打开了一个新时代

百度断然决定把4.5版本在6月30日开源,是一个重要且敏捷的决定。

几个月前,DeepSeek的发布,的确让国内的AI领域有一种瞬间“万马齐喑”的感觉,特别是多年重度投入AI的大厂们更是受到了重重追问。

带着文心4.5 Turbo和文心X1 Turbo这两个具有很强竞争优势的新模型回归,百度用这种方式表达了自己的生存哲学——不但要跟进,还要打到终局模式。

客观来讲,DeepSeek的开源(尽管其也有闭源版本),对公众而言,是在开源和闭源的天秤上,在“开源”这一侧放下了一颗重重的砝码。

可以说,从这一刻开始,大模型竞争从单纯的对比参数、打榜、发论文,变成了真刀真枪的PK自家模型的行业渗透率和普及率。

我曾经写过,百度AI的生存哲学,核心就是竞争与创新。你也可以理解为,百度视AI核心业务的发展为一个非常长期的竞争过程,而技术创新是其生存竞争优势得以存在的重要保证。

既需要拉升渗透率,又需要持续的投入一场创新和竞争的马拉松,显而易见,这是一场“无限游戏”,所以百度毅然选择了开源模式。而且笔者甚至还猜测,在未来,对若干具有市场竞争力的大版本持续开源,或将成为百度的一种新的模式。

之所以产生这样的结果,最大的时代背景是——大模型已经从“尝新期”进入成熟期,已经从“炫技”变成“应用为王”,目前各大势力的核心目标都已经不再是飙指标,而是希望迅速进入千行百业的实际应用场景中,通过占据场景来“分蛋糕”。这种情况下,开源部分具有明显优势的核心版本,是最有效、最及时的办法。

百度本身就是国内罕有的四层架构俱全的全栈型AI公司,加之其拥有被成为“大模型的操作系统”的深度学习框架飞桨,这都让百度有了维持一场长期的,同时既比拼模型性能也比拼生态厚度的竞争的前提条件,这也是4.5版本开源的另一个宏观战略背景。

更具体的说,一方面,文心4.5的开源,以其优异的性能,显然能够吸引更多开发者参与到这一版模型的优化与创新中来,从而汇聚各方智慧,加速模型性能的提升。

而另一方面,大模型的应用普及期已经开启,通过开源,百度可以与上下游企业、科研机构以及广大开发者建立更紧密的合作关系,共同探索大模型在更多领域的应用,推动整个行业的发展,从而切下更大的一块“蛋糕”。

而除了以上的宏观意义之外,从微观层面来看,百度此次开源,也将带来更强的商业化效率。例如,一方面坚持开源基础模型(文心4.5)吸引用户,另一方面,通过千帆平台企业版(MaaS服务),以及重点行业的私有化部署、定制化需求等实现高端盈利。

结语

百战归来,仍是少年

作为一个长期跟踪百度AI战略的行业研究者,我当然难以忘却百度在前几年对闭源模式的偏爱,以及其背后的原因,如认为闭源模式更有效率等等。

所以,我也一度认为,百度虽然必然会在某个时刻、某个版本上转向开源,但“偶像包袱”和“面子问题”,都会引发争议和困惑。



但是没想到,说转就转了,可谓快速决策,灵活转身。

我为百度的干脆感到高兴,从更深层次来说,这不仅说明了百度求真务实、洞察时代潮流变化的战略洞察力,也说明百度及其领导者身上仍然具有创业企业的灵活性和活力,对于一家创立了25年的公司来说,能保留这种初心和活力,本身就是一种竞争力。

或许,此前百度的追求中,除了发展AI技术创新以外,也有对自己是行业领头羊的内心骄傲。但现在看来,百度的追求变得更加务实和接地气——在认定“应用”是目前的头等大事后,百度可以说方方面面的努力都是服务于“应用”。但这种“服务”的本质,是苦心经营自己的底层核心竞争力、提升自家基础大模型的核心能力和成本优势后,对行业能够更好、更便宜的去应用AI资源的一种最好的支持。

而这种努力的具象,就是眼前的这次开源;我认为这次开源是百度的一道关口,过了这道关,百度会放下很多历史包袱,会以更加灵活和充满活力的姿态,参与AI赛道的长跑,去争取无尽游戏的终局胜利。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山东一学校党委书记,不幸因病离世!年仅52岁

山东一学校党委书记,不幸因病离世!年仅52岁

鲁中晨报
2025-11-10 10:39:12
从全球第一到业绩腰斩!公牛集团被房地产拖垮,十几亿准备跑路

从全球第一到业绩腰斩!公牛集团被房地产拖垮,十几亿准备跑路

混沌录
2025-11-10 19:19:08
金价,突然猛涨!

金价,突然猛涨!

证券时报
2025-11-10 23:35:04
卫健委通报医院回应,当事人报警,涉事副院长与女医生将被问责

卫健委通报医院回应,当事人报警,涉事副院长与女医生将被问责

现代小青青慕慕
2025-11-08 05:57:56
大反转!偷拍者被带走调查,出轨地点不是医院,祖副院长原配发声

大反转!偷拍者被带走调查,出轨地点不是医院,祖副院长原配发声

壹月情感
2025-11-10 16:52:17
邓莹 广东省台主持人,才貌双全,这是要火的节奏啊

邓莹 广东省台主持人,才貌双全,这是要火的节奏啊

手工制作阿歼
2025-11-11 01:23:39
这5位老将,还是没收到NBA球队的合同,可能真的要退役了

这5位老将,还是没收到NBA球队的合同,可能真的要退役了

篮坛扒客
2025-11-10 21:41:47
国家发改委:开放一些法律法规尚未明确规定的场景资源,在确保安全基础上允许各类企业参与

国家发改委:开放一些法律法规尚未明确规定的场景资源,在确保安全基础上允许各类企业参与

北青网-北京青年报
2025-11-10 19:51:07
1700万镑太值了,鲁尼:扎卡大概率就是本赛季英超最佳签约

1700万镑太值了,鲁尼:扎卡大概率就是本赛季英超最佳签约

懂球帝
2025-11-11 01:45:04
女子高铁推婴儿车堵道后续:正脸照流出,黑皮胖脸,知情人曝更多

女子高铁推婴儿车堵道后续:正脸照流出,黑皮胖脸,知情人曝更多

揽星河的笔记
2025-11-10 14:37:42
以1敌7国,中方为琉球正名,高市已为战争铺路,日本前首相出山

以1敌7国,中方为琉球正名,高市已为战争铺路,日本前首相出山

知鉴明史
2025-11-10 20:22:08
50万架军机对付中国!南海若交战,结局只有6字,美防长突然下令

50万架军机对付中国!南海若交战,结局只有6字,美防长突然下令

影孖看世界
2025-11-10 19:16:09
刘道玉在乎什么?

刘道玉在乎什么?

洞见财经
2025-11-09 15:12:16
率重庆冲超!66岁韩国名帅庆典磕头跪谢球员,名记质疑:大可不必

率重庆冲超!66岁韩国名帅庆典磕头跪谢球员,名记质疑:大可不必

我爱英超
2025-11-10 21:20:54
朱孝天方回应被踢出F4,刚合体时就挺不合群,如今开公司当老板

朱孝天方回应被踢出F4,刚合体时就挺不合群,如今开公司当老板

萌神木木
2025-11-10 18:18:40
被大疆60天“偷家”,影石到底有没有护城河?

被大疆60天“偷家”,影石到底有没有护城河?

搜狐科技
2025-11-10 14:52:07
湘江惨败后,毛主席在担架上幡然醒悟,一个'世界巨人'从此苏醒

湘江惨败后,毛主席在担架上幡然醒悟,一个'世界巨人'从此苏醒

何氽简史
2025-11-10 12:31:58
副院长与门诊副主任不雅照,背后的警示?

副院长与门诊副主任不雅照,背后的警示?

小小一米月儿
2025-11-08 08:57:20
场均33.8分12板6助,连破NBA历史纪录!独木难支,球队该放你走了

场均33.8分12板6助,连破NBA历史纪录!独木难支,球队该放你走了

老梁体育漫谈
2025-11-11 00:46:12
五战全赢+净胜111分!广东队最大对手退出争冠,男篮首枚金牌出炉

五战全赢+净胜111分!广东队最大对手退出争冠,男篮首枚金牌出炉

绯雨儿
2025-11-10 15:03:48
2025-11-11 07:04:49
胡说成理 incentive-icons
胡说成理
一个记录胡喆和他的朋友们,关于智能时代和智能时代的生意逻辑的小天地。
181文章数 28关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

巴菲特:已捐出13亿美元股票 感叹活到95岁是幸运

头条要闻

巴菲特:已捐出13亿美元股票 感叹活到95岁是幸运

体育要闻

重返诺坎普!梅西:希望有一天能回来

娱乐要闻

51岁周迅的现状 给中年女性提了个醒?

财经要闻

北大医药董事长被抓 巨额资金去向不明

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

亲子
本地
数码
旅游
公开课

亲子要闻

全周期赋能中国母婴健康,八赴进博会聚焦生命早期1000天

本地新闻

这届干饭人,已经把博物馆吃成了食堂

数码要闻

苹果服务主管Eddy Cue:Apple TV暂不会推出“带广告的订阅服务”

旅游要闻

19 个名字藏六朝风云!南京玄武湖:藏着中国最鲜活的千年时光!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版