网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

假开源真噱头？Meta再陷「开源」争议，LeCun被炮轰Meta只是开放模型

2024-07-19 10:16:54　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：耳朵

【新智元导读】大模型开源的热潮下，隐藏着诸多问题，从定义的模糊到实际开放内容的局限性，Lecun再陷Meta大模型是否真开源的质疑风波只是冰山一角。

在热火朝天的大模型市场，早已形成了「开源派」和「闭源派」两大门派。

开源被视为技术共享和创新的一种重要方式。实际上，大模型开源相比传统软件开源，情况要更加复杂。

在开源的定义、性质、开放内容和开源策略上都有不同的标准和内容。

因此，「开源派」的帽子并不是那么好戴的。

Meta发布了Llama系列生成AI模型的最新版本Llama 3 8B和Llama 3 70B并宣称是完全开源的，就引来了许多质疑。

Llama 3模型并不是真正意义的开源，至少不是按照最严格定义的开源。

开源意味着研究开发人员可以自由选择如何使用这些模型，不受限制。

但在Llama 3的一些案例中，Meta对于一些许可的授权进行了限制。

例如，Llama模型不能用于训练其他模型；拥有超过7亿月活跃用户的应用程序开发人员则必须向Meta申请特殊许可证。

许多学者和研究机构也注意到了对于「开源」一词的滥用情况，许多标榜为「开源」的大模型都存在重大限制，「真假开源」存疑。

diss闭源却「翻车」？

Meta掌门人Mark Zuckerberg在上周四发表的一篇访谈中谈到了他对人工智能未来的看法，他深信「不会只有一种人工智能」。

Zuckerberg着重强调了开源的价值，即把人工智能工具交到许多人手中。

他还不忘diss那些他认为不够开放的竞争对手，并补充说他们似乎认为自己在「创造上帝」。

小扎的采访句句绵里藏针，原话也有许多值得细品的点。

「I find it a pretty big turnoff when people in the tech industry…talk about building this ‘one true AI,’ It’s almost as if they kind of think they’re creating God or something and…it’s just—that’s not what we’re doing, I don’t think that’s how this plays out.」

当科技行业的人...谈论打造「唯一真正的人工智能」时，我觉得这让人非常反感。这几乎就像是他们认为自己在创造上帝之类的东西，而这根本不是我们正在做的事情，我也不认为事情会这样发展。

小扎认为，打造唯一真正的AI听上去刺耳又令人反胃，暗含一种垄断和控制的野心，你是「唯一真正的AI」，那其他AI都是歪门邪道？

其次，创造上帝是用来讽刺追求「唯一真正的AI」的人，狂妄地想要把握AI领域的绝对话语权。

最后，小扎赶紧和这些人划清界限，不是一路人。

可见，小扎认为AI世界应该是百花齐放、百家争鸣的，一家独大绝不可取。

CEO的言论也代表了Meta的态度，Meta一直以来都宣传秉持着开放的态度，Zuckerberg更是开源的坚定支持者。

diss一出也会面临各种评论「diss back」的挑战，你说你是开源，真的吗？

Meta的首席人工智能科学家Yann LeCun上个月在LinkedIn上发布了有关 Meta公司免费发布大型语言模型战略的帖子。

一些评论者对其做法大加赞赏，称其正在「重塑行业合作」。

也有人不同意LeCun将这一战略描述为「开源」。

一位评论者写道，「这绝对只能叫做开放模式而非开源，称某些东西为开源而实则并非开源，实在是对开源运动的曲解。」

另一位评论者说，「很遗憾，在这种情况下，开源只是数据洗钱的营销手段。」

第三位专家建议Meta将Llama模型称为「开放权重」，而不是「开源」。因为该公司共享模型权重，但不共享训练数据等信息。

这似乎是语义学上的争论。但是，一些模型，包括Meta、法国Mistral和德国Aleph Alpha的模型，是否真正开源，已经成为人工智能工作者，尤其是学术研究人员之间反复争论的问题。

对于这个问题的答案也会带来相关政策的导向。

欧盟的《人工智能法》规定，开源模型不受某些法条的限制。

如果欧盟认为某个模型是开源的，那么它可能会要求模型制作者必须公开关于如何开发模型的信息。

什么才算「开源」？

这种争论源于开源人工智能缺乏一个明确的定义。

为开源软件制定标准的「开源计划」目前正在制定开源人工智能的定义。

它对开源软件的定义有几个标准，包括软件必须允许自由再分发并包含源代码。

除此之外，该非营利组织和其他开源软件的支持者还强调技术的透明度和同行评审制度。

但一些开源支持者表示，开源软件的传统定义并不能很好地诠释AI大模型开源。

软件开源是指源代码的开源，拿到源代码就能「知其然而知其所以然」，可以在源代码的基础上，进行修改优化或增加新功能。

然而，许多自称开源的大模型开发者并不是真正的开源，虽然这些大模型提供了部分代码和训练好的权重，但在训练数据和具体训练过程透明度却有所欠缺，或者很少分享他们的模型是如何训练和微调的。

例如，Meta的Llama3要求月活跃用户超过7亿的公司申请许可证，而这些公司的申请后享有的权利可能比Llama3的一般协议还要少。

OSI尚未批准Meta的许可证，这表明该组织认为开发者遵循了其开放源码软件标准。

OSI执行董事Stefano Maffulli在接受TechCrunch采访时说，「参与评审的其他人都完全同意，Llama本身不能被视为开源。与我交谈过的在Meta工作的人都知道，这有点牵强。」

在OSI为开源人工智能下定义的同时，一些研究人员和学者也开始自己动手。

该框架并不敲定一个模型的代码是开放的还是封闭的，而是为14项标准中的每一项划定一个等级:开放、部分开放或封闭。

因此，在这一框架下，Meta的Llama2被评为封闭代码，而不是开放代码。

因为「该模型的源代码都没有公开，而且只共享了运行该模型的脚本」。

相比之下，研究小组BigScience Workshop的BloomZ模型在这一标准上被评为开放，因为它「提供了用于训练、微调和运行模型的源代码」。

论文作者、拉德布德大学语言技术助理教授Andreas Liesenfeld表示，「我们发现，模型制造商存在过度营销的问题，他们将自己的产品宣传得比他们所说的更开放。」

他补充说，「如果不了解模型是如何训练的以及训练的内容，就很难解决法律责任和公平性的问题。」

与此类似，斯坦福大学基金会模型研究中心的研究人员去年10月推出了基金会模型透明度指数，根据100项指标来衡量模型开发商的透明度。

论文地址：https://hai.stanford.edu/news/introducing-foundation-model-transparency-indexhttps://crfm.stanford.edu/fmti/fmti.pdf

该指数给Meta在模型基础知识、访问和能力方面的透明度打了高分，但在数据和劳动力方面的透明度较低。

该指数的共同创建者、斯坦福大学计算机科学副教授Percy Liang说，「拥有开放权重或开放源代码的模型、训练数据和代码，对于学术机构、研究人员或只想了解科学的公司来说，将是一个巨大的好处。」

大模型作为一个黑匣子，模型中可能存在各种不确定的东西，只有对模型所训练的数据有实际的保证，才能真正确保模型足够「开源」。

开源内容的局限性

一般开放的内容

在绝大多数宣称自己是开源模型的案例中，开源大模型通常只开放以下几部分内容。

代码：实现大模型训练和推理所需的代码，包括模型架构、训练算法、模型推理等核心代码。

这些代码让开发者能够理解模型的基本结构和推理过程，但无法完全复现或改进模型，增加功能等等。

权重：训练完成后得到的模型参数，这些参数是模型在推理过程中所需的核心要素。

权重数据使得开发者能够在现有模型基础上进行相关推理，但对模型的核心训练细节，例如如何进行模型训练却一无所知。

例如，Meta的Llama系列模型只开放了模型的权重和部分代码，而对训练数据和具体训练过程的详细信息却守口如瓶。

这种有限的开放使得开发者只能使用现有模型进行推理，依葫芦画瓢，而无法深入理解或改进模型。

未开放的关键内容

然而，对于大模型来说，真正决定其性能的关键在于这些通常保密的训练数据和训练过程。

训练数据：原始训练用的数据集和数据来源，以及在训练过程中进行数据处理和预处理的细节。

这些数据通常包含大量的高质量、有代表性的文本数据，对模型的性能至关重要。

然而，大部分开源模型并未公开这些训练数据。

例如，Llama系列模型虽然提供了训练好的权重，但并未公开其训练所用的数据集及其详细信息。

缺乏这些数据，开发者就无法对模型进行重新训练或在相似任务上进行微调。

训练过程：具体的训练步骤、参数设置、优化方法等。

这些细节决定了模型的训练效果和最终性能，但在所谓的「开源」大模型中，这些信息往往是闭源的。

例如，尽管一些大模型提供了部分代码和权重，但训练过程中使用的超参数、数据增强方法、训练策略等关键细节并未公开。

这种不完全开放的做法使得开发者在复现模型时面临诸多困难，无法真正掌握模型的核心技术，限制了他们对模型进行优化和改进的能力。

实际上，它们提供的只是使用现有模型的使用便利，而不是完全的技术透明和开发自由。

参考资料：

https://www.theinformation.com/articles/what-counts-as-open-source

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

外媒：中国电动汽车即将登陆加拿大经销商等不及了

澎湃新闻 2026-05-18 07:30:49
4796 跟贴 4796
如何看“泡水货”杨梅？水果店老板教辨别技巧：一摸、二闻、三尝

星视频 2026-05-18 11:59:21
138 跟贴 138

5月19日起铁路部门在京张高铁试点推出“自行车随身行”服务

澎湃新闻 2026-05-18 11:34:30
1476 跟贴 1476

武功山景区遭“臭屁虫”围攻？有游客调侃“张嘴能吃饱”，景区提醒：可自备防虫药物

潇湘晨报 2026-05-14 17:33:19
585 跟贴 585
“卖一度电，亏一度电” ！广西146家售电企业，平均每家亏损442万元

中国能源网 2026-05-18 11:34:14
2346 跟贴 2346

“计划有变，准备夺冠！”张雪机车从“昙花一现”到“实力使然”

大象新闻 2026-05-18 20:51:07
20 跟贴 20

美债冲破5%“死亡线”！美银Hartnett： 6月初是逃顶窗口

每日经济新闻 2026-05-18 12:26:40
1105 跟贴 1105
8公里跑+8项力量 75岁王石与搭档夺冠锁定世锦赛资格

界面新闻 2026-05-18 13:42:03
1838 跟贴 1838

王力宏承认用代言费购买比亚迪股票 “如果10年前投资了比亚迪，现在翻了多少倍了，这次会把握好机会”

每日经济新闻 2026-05-18 20:20:13
0 跟贴 0
重复收费、过度诊疗…… 中山市第三人民医院被罚472万元

南方都市报 2026-05-18 17:22:23
55 跟贴 55
江苏省消防救援总队副总队长朱亚明接受审查调查

界面新闻 2026-05-18 10:31:47
56 跟贴 56
CBA季后赛：浙江浙商证券胜深圳马可波罗

极目新闻 2026-05-18 22:55:54
19 跟贴 19
三大运营商Token套餐全上线

极目新闻 2026-05-18 19:56:26
126 跟贴 126
普京将对中国进行国事访问外交部介绍此访有关安排

澎湃新闻 2026-05-18 15:34:33
33 跟贴 33
C罗，别让求胜心变成一种偏执

上观新闻 2026-05-18 23:37:44
15 跟贴 15
打破魔咒！哈登生涯至今首次客场抢七取胜

北青网-北京青年报 2026-05-18 21:12:44
41 跟贴 41
装修工人利用虹吸原理巧解排水难题。网友：早学会这招，就不一勺一勺舀了！#睡个好觉

环球网资讯 2026-05-18 23:02:40
24 跟贴 24
不能吃！“泡药杨梅”被曝光，最新消息→

8099999街头巷尾 2026-05-18 14:18:10
71 跟贴 71
广汽董事长冯兴亚回应埃安被称“网约车之王”：这是对品质最好的验证

界面新闻 2026-05-18 15:51:19
123 跟贴 123
统计局：4月一线城市商品住宅销售价格环比上涨

国家统计局 2026-05-18 09:34:55
171 跟贴 171
连花清瘟胶囊/颗粒荣获“中药现代化三十年示范品种”

闪电新闻 2026-05-18 15:46:07
135 跟贴 135
1—4月份国民经济保持稳中有进发展态势

央视新闻客户端 2026-05-18 10:03:37
6 跟贴 6
“湖北襄阳特大暴雨致道路及车辆被淹”系谣言（2026·05·18）

今日辟谣 2026-05-18 17:57:28
22 跟贴 22
52对新人参加江苏青年国风集体婚礼，孟非现场送祝福

澎湃新闻 2026-05-18 23:24:27
2 跟贴 2

利物浦标价2500万欧放人，基耶萨或重返意甲

利物浦标价2500万欧放人，基耶萨或重返意甲

体坛观察猿

2026-05-19 01:47:33

14岁被送上导演的床，17岁拍全裸写真，被操控半生，如今怎样了？

14岁被送上导演的床，17岁拍全裸写真，被操控半生，如今怎样了？

不似少年游

2026-04-17 19:31:49

同一棵杨梅树：出口欧洲干干净净，卖给国人疯狂泡药，真相扎心了

同一棵杨梅树：出口欧洲干干净净，卖给国人疯狂泡药，真相扎心了

宝哥精彩赛事

2026-05-19 01:33:09

浙江杭州一校花太漂亮了，身高170五官精致，美得让人移不开眼

浙江杭州一校花太漂亮了，身高170五官精致，美得让人移不开眼

小椰的奶奶

2026-05-18 14:41:15

唯一不与中国建交的邻国，首都离中国仅45公里，曾实行一妻多夫

唯一不与中国建交的邻国，首都离中国仅45公里，曾实行一妻多夫

抽象派大师

2026-05-17 02:10:48

史上最大泰坦重现东南亚！身高体重打破纪录，全球变暖竟是诱因

史上最大泰坦重现东南亚！身高体重打破纪录，全球变暖竟是诱因

補懂事的孩紙

2026-05-15 20:47:17

天坛为什么不能随便去？真正原因很多人不知道，不是迷信

天坛为什么不能随便去？真正原因很多人不知道，不是迷信

叮当当科技

2026-05-15 18:23:34

事事顺心！下月运道最旺的3个生肖：终于轮到你们发财了

事事顺心！下月运道最旺的3个生肖：终于轮到你们发财了

毅谈生肖

2026-05-17 10:14:29

中国红会被国际红会拒绝承认的原因，善款规则让自己人都愤怒

中国红会被国际红会拒绝承认的原因，善款规则让自己人都愤怒

干史人

2025-01-23 07:05:02

说实话，我从没见过比她更绝的美人！一眼绝仙女棒，看呆了

说实话，我从没见过比她更绝的美人！一眼绝仙女棒，看呆了

东方不败然多多

2026-05-19 01:56:40

一定要多存钱，存款达到“这个数”，以后的生活就有保障了，你有吗？

一定要多存钱，存款达到“这个数”，以后的生活就有保障了，你有吗？

CG说科技

2026-05-18 17:32:08

乌克兰通过法律程序，将“俄乌战争”，命名为“乌克兰独立战争”

乌克兰通过法律程序，将“俄乌战争”，命名为“乌克兰独立战争”

我心纵横天地间

2026-01-22 18:41:25

高血压一点酒都不能沾？医生怒斥：高血压喝酒，或许有这3个变化

高血压一点酒都不能沾？医生怒斥：高血压喝酒，或许有这3个变化

冷眼看世界728

2026-05-18 22:27:01

2-3！英超金靴在美职联12场0球+率队4连败，梅西的含金量还在提升

2-3！英超金靴在美职联12场0球+率队4连败，梅西的含金量还在提升

球场没跑道

2026-05-18 12:16:48

厦门一男子向好友借10万元并出具借条，收到后当日转回7500元，法院认定7500元是“砍头息”，实际借款本金92500元

厦门一男子向好友借10万元并出具借条，收到后当日转回7500元，法院认定7500元是“砍头息”，实际借款本金92500元

大风新闻

2026-05-18 11:09:41

未来10 年哪些行业可能迎来爆发？高考报什么专业？

未来10 年哪些行业可能迎来爆发？高考报什么专业？

新浪财经

2026-05-17 23:58:16

狂奔的泰兰尼斯，还稳吗

北京商报

2026-05-18 22:40:14

75岁姜昆近况：与46岁单身爱女相依为命，日子过得让人羡慕

75岁姜昆近况：与46岁单身爱女相依为命，日子过得让人羡慕

娱说瑜悦

2026-04-04 15:38:01

杀夫案主犯程海燕被执行死刑，执刑前，向儿子坦白丈夫的秘密

杀夫案主犯程海燕被执行死刑，执刑前，向儿子坦白丈夫的秘密

纸鸢奇谭

2025-03-15 15:19:06

2亿成本，《出入平安》‍上映3天票房跌至8万，片方亏到怀疑人生

2亿成本，《出入平安》‍上映3天票房跌至8万，片方亏到怀疑人生

电影票房预告片

2026-05-18 23:56:58

AI产业主平台领航智能+时代

15243文章数 66875关注度

往期回顾全部

科技要闻

苹果WWDC26定档6月9日凌晨：iOS27将亮相

头条要闻

赖清德要求美国继续向台出售武器外交部表态

头条要闻

赖清德要求美国继续向台出售武器外交部表态

体育要闻

58顺位的保罗，最强第三中锋

娱乐要闻

票房会破14亿！口碑第一电影出现了

财经要闻

中国芯片，怎么突然不便宜了？

汽车要闻

40.98万起！充电5分钟纯电续航420km 腾势N9闪充版胜算有多少？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

本地

手机

数码

健康

艺术要闻

震惊！日本80后画家画少女，超写实美到窒息！

本地新闻

用苏绣的方式，打开江西婺源

手机要闻

全系2亿像素主摄+超大底！荣耀Magic9系列影像规格曝光了

数码要闻

TOPPING拓品推出DX1 II游戏HiFi解码耳放一体机，769元

专家揭秘干细胞回输的安全风险

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版