网易首页 > 网易号 > 正文 申请入驻

先别急着骂李开复

0
分享至



最近一周,陷入“抄袭”风波的李开复,心情如同过山车。

11月6日,李开复创办的AI公司零一万物,正式发布了首款开源中英双语大模型“Yi”。

该模型包含 Yi-6B 和 Yi-34B 两个版本,其Yi-34B 版本是当时唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型,称“全球最强开源模型”,因此吸引了全球多位研究者的关注。


本是好评如潮, 然而,一周后,阿里前AI科学家贾扬清指称,某国产大模型实际上是抄袭的LLaMA,只是更换了几个变量名而已。


虽未点名,但这个节骨眼上,还是有不少业内人士将其与零一万物联系在一起。

此前,Hugging Face 开发者 ehartford 公开表明,零一万物开源大模型使用了 Meta 的 LLaMA 架构,只对两个张量名称(input_layernorm,post_attention_layernorm)进行修改,但其开源许可证也没有提及LlaMa。


一石激起千层浪,事情不断发酵,15日,零一万物作出了回复:


回应原文中的“沿用了GPT/LLaMA的基本架构”,表明零一万物直接承认确实用了LLaMA的结构。

11月14日,其团队开源总监 Richard Lin 在Hugging Face社区原贴之下也指出“命名问题是团队的疏忽,在大量训练实验中,我们对代码进行了多次重命名以满足实验要求。“

LLaMa是meta 发布的一个免费开源的大模型,LLaMa的许可协议里提到,开发者有义务提供一个“Notice”文本文件,保留LLaMa的版权归属

用LLaMa一样的架构其实并不新鲜,此前百川智能的开源模型Baichuan-7B就是如此。

只是大家介意的是零一万物用的是LLaMa的结构,但没有保留原创,而是拿着两个变量的模型,宣称是自己的自研。

简单来说,大众认为,署名就是借鉴,不署名可能就是抄袭了

对此,ehartford 也补充道,他只是提醒 Yi 团队调整张量名称来匹配相关资源,直接套用 LLaMA 架构没有任何问题,训练才是重点

估计ehartford本人也没想到,会引起这么大的风波。

而作为零一万物的创始人,李开复也反复被人提及。


1961年,李开复出生于中国台湾新北市,就读于卡内基梅隆大学,获计算机学博士学位,后担任副教授,曾先后担任微软全球副总裁、谷歌全球副总裁兼大中华区总裁。

2009年,48岁的李开复从谷歌离职,回国创办了创新工场,投资孵化了多家中国互联网巨头,如美团和支付宝等。

到2018年,已经成功培育出了10家独角兽公司,其中5家专注于人工智能领域。

李开复在人工智能领域积累了40年 的科研和产业经验,一度被称为“中国AI教父”。

今年3月,李开复再度创业,牵头筹组成立AI2.0公司——零一万物。

公司的联创团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁,算法和产品团队背景均来自国内外大厂。

四个月后,零一万物便在11月份推出了“Yi”系列大模型产品,并凭借Yi-34B一炮而红。

在Hugging Face 英文测试榜单中,以 70.72 分数位列全球第一


在线上发布环节,李开复重点介绍了 Yi 系列大模型的三大性能亮点:

  • 全球最长 200K 上下文窗口,免费开源,可商用

  • 超强 Al Infra 实测训练,成本下降40%

  • 科学训模自研「规模化训练实验平台」

Yi-34B将发布可支持200K上下文窗口(context window)版本,可以处理约40万汉字超长文本输入。相比之下,OpenAI的GPT-4上下文窗口只有32K,文字处理量约2.5万字。

你说“Yi”模型是抄袭吗?

未必。

据智药局了解,大模型选择相同的架构也可以做出完全不同的模型,用不同数据集训练出来的模型也会有所差别。

也就是说,即使壳子一样,但内芯还是有区别的

在“抄袭”风波中,零一万物也回应到:“模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter 设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI Infra 能力等,投入了大量研发和打底工作。”

此前,为了解决超长上下文这一重要技术限制,零一万物实施了一系列优化,包括:计算通信重叠、序列并行、通信压缩等。通过这些能力增强,实现了在大规模模型训练中近 100 倍的能力提升。

在训练数据上,李开复直言零一万物团队通过正规渠道购买和爬取的方式,获得了 100T 的中英文数据,并选取了其中 3T 的优质内容进行训练

抄袭可大可小,不仅是李开复个人和零一万物一生的污点,更是对中国AI大模型创新环境的一种打击。

对事不对人,不管此次“无声”套用 LLaMa 架构,是没注意还是疏忽,零一万物都应该改进署名,但说抄袭还不至于,毕竟不能对团队背后的努力视而不见。

不仅是科技领域,在任何一个领域,诚信与透明度同等重要,保留原创是体面也是尊重,毕竟谁也不是傻子不是?

—The End—


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张韶涵的“渣女站姿”火了!腿缝几乎没有间距, 看得人眼睛都直了

张韶涵的“渣女站姿”火了!腿缝几乎没有间距, 看得人眼睛都直了

阿芒娱乐说
2024-04-27 12:23:34
“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

星辰故事屋
2024-03-08 21:12:51
广州白云钟落潭疑现龙卷风,增城黄埔已发警报!出现雷电冰雹

广州白云钟落潭疑现龙卷风,增城黄埔已发警报!出现雷电冰雹

南方都市报
2024-04-27 16:36:15
广东卫健系统三任前一把手被查,一局长被点名“吃高档菜肴”

广东卫健系统三任前一把手被查,一局长被点名“吃高档菜肴”

澎湃新闻
2024-04-27 13:32:27
美国国务卿布林肯在北京购买了窦唯的专辑唱片

美国国务卿布林肯在北京购买了窦唯的专辑唱片

花非花008
2024-04-27 09:25:53
普京气炸了!俄罗斯布里亚特共和国代表在联合国的精彩演讲

普京气炸了!俄罗斯布里亚特共和国代表在联合国的精彩演讲

娱宙观
2024-04-26 14:10:55
布林肯离开北京前,等到了接见通知,中方的特殊安排有深意

布林肯离开北京前,等到了接见通知,中方的特殊安排有深意

刘庆彬
2024-04-27 09:06:50
去年以来北京警方破获侵犯知识产权犯罪案件550余起 刑拘820余名犯罪嫌疑人

去年以来北京警方破获侵犯知识产权犯罪案件550余起 刑拘820余名犯罪嫌疑人

北青网-北京青年报
2024-04-26 17:25:03
习主席用这句古语,点中了布林肯的“心思”

习主席用这句古语,点中了布林肯的“心思”

直新闻
2024-04-26 22:39:10
引众怒!中国女生被恶意赶下澳洲航班,全体乘客竟鼓掌嘲笑!“这就是种族歧视...”

引众怒!中国女生被恶意赶下澳洲航班,全体乘客竟鼓掌嘲笑!“这就是种族歧视...”

澳洲红领巾
2024-04-27 13:14:19
马斯克被立案调查,“大清洗开始了”

马斯克被立案调查,“大清洗开始了”

蓝钻故事
2024-04-21 15:26:13
业绩增长10倍,股价跌去70%,葛卫东抄底1800万股被套,科技龙头

业绩增长10倍,股价跌去70%,葛卫东抄底1800万股被套,科技龙头

资本百科
2024-04-27 06:30:09
俄罗斯冻结美国最大银行在俄资产!乌方:俄乌冲突以来已获得854亿美元财政援助

俄罗斯冻结美国最大银行在俄资产!乌方:俄乌冲突以来已获得854亿美元财政援助

每日经济新闻
2024-04-27 00:24:09
遭穆迪下调评级 万科强硬回应:坚决反对

遭穆迪下调评级 万科强硬回应:坚决反对

财联社
2024-04-27 14:15:11
重磅!武汉病毒所石正丽团队发布新冠溯源调查

重磅!武汉病毒所石正丽团队发布新冠溯源调查

灰产圈
2024-04-27 00:16:26
几千年都没有变过!

几千年都没有变过!

吴女士
2024-04-26 11:16:12
探花翻车事故:女子拒绝配合态度嚣张被扇脸最后双方互殴

探花翻车事故:女子拒绝配合态度嚣张被扇脸最后双方互殴

挪威森林
2024-04-26 20:45:21
侮辱性极强!独行侠悍将晒霸气照疯狂扎心威少 东契奇秒点赞

侮辱性极强!独行侠悍将晒霸气照疯狂扎心威少 东契奇秒点赞

厝边人侃体育
2024-04-27 12:31:23
清凉峰一男一女最新后续:知情人透露二人关系,丈夫愤怒二次发声

清凉峰一男一女最新后续:知情人透露二人关系,丈夫愤怒二次发声

影孖看世界
2024-04-26 19:32:33
结束18年恩怨,哈马斯与法塔赫将在北京和解?为何推动者是中国

结束18年恩怨,哈马斯与法塔赫将在北京和解?为何推动者是中国

说天说地说实事
2024-04-26 15:33:02
2024-04-27 18:32:49
智药局
智药局
我们更懂药物创新
147文章数 63关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

头条要闻

19岁女生称被舞蹈老师压断腿致十级伤残 涉事机构回应

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

健康
教育
本地
游戏
公开课

这2种水果可降低高血压死亡风险

教育要闻

清华大学成立人工智能学院,姚期智任首任院长

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

《剑星》和谐问题持续发酵 网友:问题在于随意审查

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版