网易首页 > 网易号 > 正文 申请入驻

开源AI到底是什么?业界:超出开源软件范畴,需要重新界定

0
分享至

最近AI圈突然流行起开源概念。Meta承诺将会打造开源AI,马斯克起诉OpenAI,说它缺少开源模型。与此同时,一批科技领袖和科技企业纷纷为开源概念呐喊。不过科技界碰到一个难以解决的根本问题:它们对“开源AI”的概念无法达成共识。



照字面意思,开源AI意味着未来任何人都可以参与科技开发,它能加速创新、增强透明度,让用户对系统拥有更多控制权。但到目前为止没有人给“开源AI”进行明确界定,科技巨头完全可以根据自己的需要扭曲概念,甚至有可能利用开源AI稳固自身地位。

在这里我们不得不提到Open Source Initiative (OSI),它是一个非盈利组织,成立于1998年,正是它推动了开源软件的发展。OSI已经招集研发人员、律师、议员、大科技公司代表,总计约70人,试图明确界定“开源AI”概念。

OSI高管Stefano Maffulli说,他们对开源AI原则已经达成广泛共识,但细节方面分歧很多。要考虑复杂的竞争利益,要找到一套方案让所有人满意,要让大企业积极参与,真的不容易。

大厂的态度

去年7月,Meta开源Llama 2模型。Meta AI与开源事务法律副总顾问Jonathan Torres说:“我们支持OSI明确定义开源AI,为了全球开源社区的利益,我们会积极参与定义工作。”

相比Meta,OpenAI显得没有那么积极。在过去几年前,OpenAI很少谈及自己的研发进度,理由是安全无法保证。OpenAI新闻发言人称:“只有当我们谨慎评估好利益与风险,包括误用、加速等问题,才会考虑将强大的AI模型开放。”



Stability AI和Aleph Alpha已经提供一些开源模型,Hugging Face托管了一批免费使用AI模型。

谷歌Gemini和PaLM 2模型也没有开源,但Gemma模型已经可以免费使用,它的对手是Meta Llama 2,但谷歌所说的不是“开源”,而是“开放”。

到底上述模型能不能称为“开源”,大家意见并不统一。不管是Llama 2还是Gemma都需要获得授权,使用时会受到限制,苛刻的要求无疑是与开源相违背的。既然开源就不能施加任何限制,科技企业显然没有做到。

OSI高管Stefano Maffulli称,开源的目的本来是要确保开发者可以随意使用、研究、修改、分享软件,不施加任何限制,但AI的运行方式有些不同,所以原本适用于软件的开源理念无法流畅转移到AI领域。

Stefano Maffulli解释称,AI模型涉及的组件太多了,如果是软件,只需要修改底层代码就行了,AI更复杂,根据目的的不同,修改AI模型会牵涉到训练模型、训练数据、处理数据的代码、管理训练流程的代码,还有模型的底层架构等。

基本自由是什么?基本权利是什么?我们都需要明确界定。为了执行基本权利如何操作也不够明晰。只有定义明确,定义被大家尊重、接受才能降低合规成本,减少摩擦,分享知识。

当前的症结在于数据。所有大型科技企业只是简单发布了预训练模型,没有提供训练数据。如果想给开源AI下一个更明确的定义,没有数据就很难修改、研究模型,所以它们并不是开源模型。

有些人持不同意见,他们认为只要简单描述数据,研究人员就能深入调查模型,没有必要通过重新训练来修改模型。预训练模型可以通过所谓的微调进行调整,也就是用一批规模较小的特殊数据集来重新训练。

比如Meta提供的Llama 2,Meta虽然给出的是预训练模型,但已经有一批开发者下载、修改它,然后分享自己的修改结果。开发者会用它完成各种项目,它已经拥有一整套生态系统,我们能不能叫它半开放?或者叫半开源?

非盈利组织Open Future的研发人员Zuzanna Warso认为,从技术角度看,如果没有原始训练数据,研发人员无法修改模型,但没有训练数据就真的无法自由研究模型吗?这个争论点也值得商榷。

Zuzanna Warso称:“在整个流程中,训练数据是关键组成部分。如果我们真的关心开放,也应该关心数据的开放度。”

开源的意义

AI Now Institute联合执行董事Sarah Myers West去年曾发表一篇论文,她在论文中指出,许多开源AI项目缺少开放性,但她同时也指出,训练尖端AI需要大量数据和计算力,苛刻的要求限制了小玩家的参与,不管模型的开源程度如何都受到限制。

通过开源,人们希望达成怎样的目标?对于这个问题大家也莫衷一是。Sarah Myers West称:“是为了安全?为了学术研究?还是为了增强竞争?我们必须对目标有更清晰的认识,系统开放到什么程度会对目标追求产生怎样的影响,这点也需要考虑。”

OSI在定义草案中认为,开源能带来好处,其中自主、透明就是关键收益,但文件中也提到了“超出范围的问题”,比如伦理、信任、责任。

Maffulli解释称,从历史上看开源社区的关注重点是如何减少软件分享摩擦,不能陷入无限争论,比如应该如何使用软件。



有人不认同Maffulli的说法,技术是中性的,伦理问题不可控,这些有争议的问题本来就很重要,之所以拒绝讨论是避免松散的开源社区分崩离析。

除了OSI,还有一些组织也想为开源AI指明方向,比如2022年成立的 Responsible AI Licenses(RAIL),它想通过开源授权的方式限制模型特殊使用方式。拿到授权后,开发者不能以不合适、不道德的方式使用AI模型。在Hugging Face的托管平台上,已经有28%的模型使用了RAIL授权。

谷歌Gemma的授权也遵循相似的原则,拿到授权的开发者不能将模型应用于有害场景。艾伦人工智能研究所也制定了自己的授权规则。

开源软件管理公司Tidelift的联合创始人Luis Villa认为,考虑到AI与常规软件有所不同,探索不同程度的开放是难以避免的,这样做对整个行业也可能是有益的。但是各种开放授权互不兼容可能会影响协作,只有协作能让开源走向成功,除此还有其它一些负作用,比如AI创新会受影响,透明度会降低,小玩家参与难度提升。

社区应该围绕单一标准进行授权合并,否则就会各行其是。对于OSI的方针政策,Luis Villa也不是很认可。当初OSI提出开源软件定义时时间充裕,外部审查也很少,如今的AI环境大不相同,有大企业和监管者干涉。

如果开源社区无法给出明确的定义,其它人就会根据自己的需求各提出一套定义。Luis Villa称:“它们会填补真空,扎克伯格可能会告诉我们所谓的开源AI是什么,他讲的话影响肯定很大。”(小刀)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
灾难!韩国中卫成卧底连送皇马2球:防守失位+送点,获拜仁最低分

灾难!韩国中卫成卧底连送皇马2球:防守失位+送点,获拜仁最低分

我爱英超
2024-05-01 05:02:10
广州梅龙高速坍塌后续:事故车子被拖走,车身损毁面目全非!

广州梅龙高速坍塌后续:事故车子被拖走,车身损毁面目全非!

古希腊掌管松饼的神
2024-05-01 16:55:41
A股:刚刚,证监会和沪深交易所接连发布!“新国九条”后续来了

A股:刚刚,证监会和沪深交易所接连发布!“新国九条”后续来了

云姐闲聊
2024-05-01 08:11:51
向太新店开业,站C位的李连杰老了,香港店预约难,人均近1800元

向太新店开业,站C位的李连杰老了,香港店预约难,人均近1800元

非常先生看娱乐
2024-05-01 00:05:00
闹大了!恒大许家印,最新判决结果来了,那些烂尾楼业主该怎么活

闹大了!恒大许家印,最新判决结果来了,那些烂尾楼业主该怎么活

奇葩游戏酱
2024-04-30 18:21:22
沙特大满贯赛今天开打!5月1日赛程公布,国乒12人免试直通正赛

沙特大满贯赛今天开打!5月1日赛程公布,国乒12人免试直通正赛

全言作品
2024-05-01 00:00:21
一根木头背后,是千万人的血和泪

一根木头背后,是千万人的血和泪

无心镜
2024-04-30 08:05:35
克罗斯还未出球,戴尔已经“仙人指路”提醒!奈何金玟哉大漏特漏

克罗斯还未出球,戴尔已经“仙人指路”提醒!奈何金玟哉大漏特漏

直播吧
2024-05-01 08:43:20
三大运营商扛不住了,联通董事长正式宣布:半夜关闭5G基站

三大运营商扛不住了,联通董事长正式宣布:半夜关闭5G基站

爆角追踪
2024-04-29 17:15:46
墨尔本当地人自制地图,专门给中国人划了个区

墨尔本当地人自制地图,专门给中国人划了个区

土澳的故事
2024-04-30 13:38:58
美国人开始认识到“阶级矛盾”了

美国人开始认识到“阶级矛盾”了

平原公子
2024-04-30 11:23:26
大陆亮出对台新政策,5月6日起实施,赖清德已断,必须统一

大陆亮出对台新政策,5月6日起实施,赖清德已断,必须统一

利刃号
2024-04-30 10:48:50
皇马进球证实图赫尔分析:10秒前根本看不到机会 克罗斯无中生有造进球

皇马进球证实图赫尔分析:10秒前根本看不到机会 克罗斯无中生有造进球

雷速体育
2024-05-01 10:51:12
吕丽萍孙海英回国看病,检查无碍后又回到美国,称习惯在那里生活

吕丽萍孙海英回国看病,检查无碍后又回到美国,称习惯在那里生活

八卦爱侃娱
2024-04-30 10:23:11
太难了!再这么搞下去,“失业”的人会越来越多

太难了!再这么搞下去,“失业”的人会越来越多

侃故事的阿庆
2024-05-01 14:08:26
男大学生诱骗多名女生“骑大马”,事后给250元!校方:基本属实

男大学生诱骗多名女生“骑大马”,事后给250元!校方:基本属实

鲁中晨报
2024-05-01 14:45:07
毛家的祖坟的秘密,伟人的一生竟然与“虎”有着不解之缘!

毛家的祖坟的秘密,伟人的一生竟然与“虎”有着不解之缘!

心灵短笛
2024-04-18 15:27:33
福建舰刚动起来,舰载机也都铺天盖地而来

福建舰刚动起来,舰载机也都铺天盖地而来

三叔的装备空间
2024-04-29 19:52:13
字母哥加盟勇士联手库里!NBA震撼交易来袭,詹姆斯直言这是作弊

字母哥加盟勇士联手库里!NBA震撼交易来袭,詹姆斯直言这是作弊

张敏
2024-05-01 11:23:59
中企赴俄:抓住机会,但也不要忽视风控

中企赴俄:抓住机会,但也不要忽视风控

经济观察报
2024-04-30 22:15:20
2024-05-01 19:34:44
极客网
极客网
科技使能新商业
2076文章数 2519关注度
往期回顾 全部

科技要闻

余承东卸任华为终端CEO 新任命为董事长

头条要闻

嫦娥六号任务计划5月3日发射

头条要闻

嫦娥六号任务计划5月3日发射

体育要闻

"意甲最佳"金玟哉 踢回了中超水平...

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

俞敏洪,踏足A股!

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

房产
本地
时尚
手机
公开课

房产要闻

单价2万内,装标4200+,主城改善大盘无套路硬刚!

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

五一快乐!致敬每一位辛勤的劳动者(有福利)

手机要闻

部分用户反映 iPhone 闹钟不响,苹果称正在修复

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版