网易首页 > 网易号 > 正文 申请入驻

中国“霸榜”全球开源大模型:光环下的隐忧与挑战

0
分享至

证券时报记者 周春媚

过去两周多的时间里,阿里通义千问陆续开源了六款模型。在这应接不暇的开源狂欢中,某AI公司的技术研发人员董铭(化名)却感到有些心力交瘁——他默默关掉了一个刚部署几天的测试集群,因为随着新模型的开源,应用程序接口又变了,而这已经是他近期第四次重写模型调用脚本。

最近,此前有些沉寂的中国大模型又重新热闹起来,无论是互联网大厂还是初创公司,都紧锣密鼓地发布了新模型,颇有2023年“百模大战”的味道。但不同的是,这一次的大模型浪潮以开源为核心,近期更新模型的公司都选择了开源的路径。与此同时,据全球知名AI开源社区Hugging Face近日公布的榜单,排名前十的开源大模型中,中国占据了九席。

中国的开源大模型正以“集群式”的崛起,重塑全球AI版图。但这在加强中国技术影响力、加快AI应用和普及的同时,也存在着隐忧。一方面,开源模型频繁迭代,但本质依然是基于主流Transformer架构的微调,能力差距并未拉开,有陷入“微调内卷”与同质化困境的倾向。另一方面,对于开发者来说,开源模型的爆发虽然提供了各式各样的工具,但也带来了反复调试、兼容成本高等挑战。

中国大模型“横扫”开源榜单

作为AI大模型大战的两个不同方向,开源与闭源孰优孰劣历来存在争议。开源是指开放源代码,允许用户修改、使用、分发,闭源则是指源代码不公开,用户仅能通过接口调用功能。

今年以前,我国大模型虽也“百花齐放”,但开源与闭源呈现势均力敌的状态,直到DeepSeek火爆出圈,国产大模型才走到了一个分水岭。业界普遍认为,DeepSeek的成功是开源的胜利,让所有人直观感受到了开源的影响力。于是,更多的中国公司选择效仿DeepSeek,转向开源路线,并将工作重点重新转向模型的优化与更新迭代中来。

今年7月底,国产大模型再次迎来了一轮开源“井喷潮”:7月22日起,阿里以“日更”的节奏,连续发布4款开源模型;7月27日,腾讯开源了混元3D世界模型1.0;7月28日,智谱发布了专为智能体应用打造的开源模型GLM-4.5;7月31日,AI大模型“六小虎”之一的阶跃星辰正式开源新一代基础大模型Step-3……

与此同时,Hugging Face在7月31日公布的榜单显示,排名前十的开源大模型中,中国占据了九席。其中,智谱的GLM-4.5排名第一,阿里的通义千问系列大模型更是独霸5个席位,同时上榜的还有腾讯混元大模型、月之暗面的Kimi K2大模型等。自年初至今,DeepSeek和阿里被外界称为“开源双子星”,Kimi K2发布后被《自然》杂志称为“又一个DeepSeek时刻”……中国开源大模型迎来了集体爆发的时刻。

“这一现象标志着中国AI从‘技术追赶’迈向‘生态主导’,核心驱动力源于‘数据—算力—场景’构筑的强劲闭环优势。”天使投资人、资深人工智能专家郭涛在接受证券时报记者采访时表示,我国开源大模型强势崛起,一方面,是由于我国大模型厂商依托海量优质中文语料,深度挖掘垂直应用场景,构建起了特色鲜明的差异化训练数据集;另一方面,以华为昇腾为代表的国产化算力底座日趋成熟,为大规模分布式训练奠定坚实基础,叠加开源社区的飞轮效应,头部企业开放代码汇聚众智,从而形成了良性循环的正向反馈。

先发者与后发者的路径分化

8月2日,国际知名大模型评测平台Chatbot Arena更新了最新一期榜单,阿里旗下最新开源的千问3超越了Grok4、Claude4等闭源模型,位列总榜全球第三,仅次于谷歌与OpenAI旗下的闭源大模型。

与此同时,作为开源模型领域的先驱,Meta创始人扎克伯格在一封公开信中表示,Meta会“谨慎选择开源内容”,这被视为Meta转向闭源的一个信号。这意味着,在中国大力拥抱开源模型的同时,闭源模型成为了美国科技公司的主流选择,发展路径已出现明显分化。

“AI的先发者必然倾向于闭源,因为先发者要巩固自己的优势,保持独特性,比如OpenAI就是从开源逐渐走向闭源;而后发者必然倾向于开源,因为只有开源,才能打破闭源者构建的生态。”工信部信息通信经济专家委员会委员盘和林在接受证券时报记者采访时表示,作为后发者,我国发展AI最佳路径就是开源,只有开源模式可以不断优化,吸引全世界开发者帮助研发算法来适配应用场景,从而获得广阔的应用生态支持。

一名人工智能资深专家告诉记者,美国的AI产业由资本驱动,有较强的资本回报预期,其盈利诉求导致AI大模型企业往往先追求技术领先,形成一定垄断后再创造巨额利润,使其倾向于选择闭源路线。但对于中国大模型厂商而言,唯有凭借开源的技术透明性,才能迅速在全球范围内获得信任,建立自己的开发者生态。“开源是一种产业优先的路径,通过开源降低使用门槛,让大模型加速成为与实体经济融合的基础设施。”该人工智能资深专家表示。

但开源并不等于放弃盈利,事实上,目前不同的模型厂商都有各自的盈利探索。比如,智谱以开源吸引更多的开发者,同时也向企业和政府客户提供付费的定制化解决方案;阿里则是通过打造强大的开源模型,吸引开发者使用其云计算等基础设施,通过云服务获取收益。

“开源模式如利刃破局,打破技术垄断壁垒,让中小企业能以低成本调用前沿模型,加速AI在智能制造质检、金融风控等领域的落地。”郭涛说,当闭源模型采取API(应用程序接口)收费模式时,中国开源模型通过微调定制服务、云平台分成等路径实现盈利,推动了AI技术的普及和应用。

光环之下的隐忧与挑战

开源模型越来越“卷”,这是今年以来从业者的普遍感受。各个厂商迭代模型的速度越来越快、版本越来越多,一个模型“登顶”之后很快又会被新的模型超越,看似是在参数性能、评测分数上“你追我赶”,实则是缺乏颠覆式创新之下的“微调内卷”与同质化困境。

“开源也好,闭源也好,所有领先模型都是基于谷歌发明的Transformer,在这个基础架构上再创新,如此而已。”开源中国董事长马越表示。前述人工智能资深专家表示,国产模型在开源榜上领先,体现的是国内厂商在算法工程化、推理性能、成本优化等方面的实力,大多数模型进步是依赖工程调优,而不是像Transformer那样的训练框架及算法创新。

硅谷基准风投公司合伙人Bill Gurley曾评价,中国开源模型之间可以互相改进,产生的组合效应非常强大,推出新模型变得更容易。但技术壁垒上的不足,导致新模型虽然愈发频繁地推出,但能力差距并未拉开。对于开发者而言,开源工具虽多,却面临密钥管理割裂、版本迭代失控等问题。

“通义、DeepSeek、GLM,每个模型都有各自的控制台和密钥。而且模型更新频繁,接口经常变化,给集成工作带来不少困扰。”董铭表示,为了快速验证新模型,开发者往往不得不反复部署临时集群,当模型更新节奏超过开发速度,开源狂欢某种程度也成为了“甜蜜的负担”。

在郭涛看来,模型高速迭代催生技术突破的同时也暗含着隐忧,不仅会带来兼容性危机,版本更迭过频导致下游应用适配成本激增,同时也可能存在创新空心化倾向,多数工作停留在参数调优,缺乏底层架构突破。对此,需推动统一API接口标准,激励开展原创性基础研究,规避低水平重复建设。

盘和林认为,靠“微调内卷”实现进步是AI基础算法突破乏力导致的,要真正引领AI范式,基础模型算法创新和算力芯片突破是绕不过去的两大门槛。“未来,需要建立中国AI的基础算法知识分享圈子,通过圈子内的相互启发,来推动中国AI算法思想的创新。”盘和林表示。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中一签赚38.9万!“易中天”概念股刷新A股上市首日最贵开盘价

中一签赚38.9万!“易中天”概念股刷新A股上市首日最贵开盘价

21世纪经济报道
2026-04-24 11:35:22
美伊将进行第二轮谈判,美防长:谈判底线是“伊朗不可能获得核弹”,对伊朗封锁已扩展至全球范围,34艘船只在霍尔木兹海峡被勒令折返

美伊将进行第二轮谈判,美防长:谈判底线是“伊朗不可能获得核弹”,对伊朗封锁已扩展至全球范围,34艘船只在霍尔木兹海峡被勒令折返

鲁中晨报
2026-04-24 21:04:06
华晨宇抚仙湖项目叫停!中国顶级淡水命脉,绝不给流量资本让路

华晨宇抚仙湖项目叫停!中国顶级淡水命脉,绝不给流量资本让路

离离言几许
2026-04-24 07:25:41
31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

极目新闻
2026-04-24 17:49:19
北控78-94不敌宁波无缘季后赛,刘晓宇18+7,廖三宁16+5

北控78-94不敌宁波无缘季后赛,刘晓宇18+7,廖三宁16+5

懂球帝
2026-04-24 21:36:07
26岁女子因常年脚冷,习惯穿着袜子睡觉,脚趾甲变“千层糕”,最终不得不接受拔甲治疗

26岁女子因常年脚冷,习惯穿着袜子睡觉,脚趾甲变“千层糕”,最终不得不接受拔甲治疗

观威海
2026-04-24 09:12:16
中际旭创市值突破1万亿,山东诞生新首富

中际旭创市值突破1万亿,山东诞生新首富

中国能源网
2026-04-24 17:42:04
中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

新华社
2026-04-24 17:05:33
原村支书开铲车当着民警面把人埋了?网友质疑民警未及时制止;山西代县公安局:已向警督部门反馈,正处置

原村支书开铲车当着民警面把人埋了?网友质疑民警未及时制止;山西代县公安局:已向警督部门反馈,正处置

大风新闻
2026-04-24 17:19:02
人社部、财政部通知:支持大学毕业生“回炉”读技校

人社部、财政部通知:支持大学毕业生“回炉”读技校

深度报
2026-04-23 22:43:47
范志毅:只有一次02世界杯不光彩;我认为足球改革春天来了

范志毅:只有一次02世界杯不光彩;我认为足球改革春天来了

懂球帝
2026-04-24 21:15:10
大闹亚航的假空姐社会性死亡!“底裤”被扒,正脸流出,十级美颜

大闹亚航的假空姐社会性死亡!“底裤”被扒,正脸流出,十级美颜

翰飞观事
2026-04-24 19:39:03
泡泡玛特:4月30日发售两款Labubu冰箱,售价5999元,每款全球限量发售999台

泡泡玛特:4月30日发售两款Labubu冰箱,售价5999元,每款全球限量发售999台

鲁中晨报
2026-04-24 20:08:07
腾讯发布了 7 个座舱智能体,汽车的意义从「空间位移」走向了「时间价值」

腾讯发布了 7 个座舱智能体,汽车的意义从「空间位移」走向了「时间价值」

爱范儿
2026-04-24 17:22:23
当不成总统了?美国四位前总统集体发声,打响扳倒特朗普的第一枪

当不成总统了?美国四位前总统集体发声,打响扳倒特朗普的第一枪

军机Talk
2026-04-24 12:07:37
芯片松绑4个月,中国一块也没买,中国不急美国急,形势反转了

芯片松绑4个月,中国一块也没买,中国不急美国急,形势反转了

王新喜
2026-04-23 20:37:56
DeepSeek-V4上线国家超算互联网

DeepSeek-V4上线国家超算互联网

界面新闻
2026-04-24 19:25:45
5月1日严查开始,家里有车、开店的抓紧办!别等罚单找上门

5月1日严查开始,家里有车、开店的抓紧办!别等罚单找上门

黑哥讲现代史
2026-04-24 04:46:42
广东91-93不敌福建 球员评价:4人优秀,8人低迷

广东91-93不敌福建 球员评价:4人优秀,8人低迷

篮球资讯达人
2026-04-24 21:36:08
被原村支书驾铲车推土掩埋村民仍在医院输液,辟谣“警察围观” 说法,警察到场后立即制止

被原村支书驾铲车推土掩埋村民仍在医院输液,辟谣“警察围观” 说法,警察到场后立即制止

红星新闻
2026-04-24 20:05:42
2026-04-24 22:32:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
902322文章数 239019关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

航班提前起飞10分钟 大学生把海航告了

头条要闻

航班提前起飞10分钟 大学生把海航告了

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

本地
数码
亲子
教育
军事航空

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

数码要闻

净水器排名前十强盘点:这些热卖品牌霸榜,什么牌子好一目了然

亲子要闻

韩国叔叔又来看小满了 看看小叔子说话那个表情 笑死...

教育要闻

官宣!西城中部教育格局变脸!老牌示范校新校区来了

军事要闻

美伊陷入互相封锁僵局

无障碍浏览 进入关怀版