网易首页 > 网易号 > 正文 申请入驻

斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

0
分享至

6月4日,两名斯坦福大学生Aksh Garg和Siddharth Sharma,承认抄袭清华和面壁智能联合开发的MiniCPM-Llama3-V2.5(以下简称V2.5)多模态大模型事件,并在社交平台公开道歉、删掉开源项目。

该抄袭事件也得到了斯坦福大学AI实验室主任Christopher Manning的认证,表扬了国内大学、企业对开源大模型的贡献,并表示对该事件毫不知情。

V2.5开源地址:https://github.com/OpenBMB/MiniCPM-V?tab=readme-ov-file

整个抄袭事件全过程

其实昨天这个事情在国内相当炸裂,登上了好几个平台的热搜榜首,「AIGC开放社区」就根据多方已经证实的内容,为大家梳理一下抄袭事件的全过程。

5月29日,斯坦福大学的AI团队宣称,他们开源了一款名叫Llama3-V的多模态模型(https://github.com/mustafaaljadery/llama3v已删除无法访问),只需要500美元就能训练出超过GPT-4V、GeminiUltra、ClaudeOpus等众多知名模型。

发布没多久,Llama3-V便成为Hugging Face上非常火热的一款开源产品。

6月2日,有开发者质疑Llama3-V抄袭国内清华和面壁智能联合开源的最新项目V2.5,主要抄袭的证据有以下几点。

1)特色功能一样:V2.5的特色功能之一是可以识别“清华简”,这是中国战国时期写在竹子上的一种非常特殊且罕见的中国古文字。

而Llama3-V居然也能识别。但这个训练数据是清华2500多张竹简中扫描下来的,并非是从公开训练数据中提取的。

2)Llama3-V的模型架构、代码、配置文件、分词器基本一样,只是增加了高斯噪声、变量名称不一样而已。

3)重叠度高达87%:为了验证是否抄袭,用户将V2.5与其他几个基于Llama3的多模态模型进行了比较,例如,Bunny-Llama-3-8B-V、Bunny-Llama-3-8B-V,模型的重叠率为0。但与Llama3-V进行比对时,重叠率居然高达87%。

此外,两者还有非常相似的误差分布。Llama3-V和V2.5分别做出了236个和194个错误预测,而重叠部分为182个。如果是原创模型根本不会有如此高的重叠度

4)犯的错误一样:用户将Llama3-V用于测试WebAgent时,居然与V2.5犯的错误一样。但V2.5使用的是内部从未公开过的训练数据,这也再一次证明Llama3-V的抄袭行为。

网上还罗列出了不少抄袭的证据,但上面4点是最致命的,基本都是同一架构、训练数据才能犯的错误Llama3-V居然全中了。

相当于两个人的脸型、眼睛、鼻子、嘴巴几乎一模一样,只是你的头发比我多一些,难道就不认我这个秃头兄弟了吗~

斯坦福AI实验室主任证实

起初这个抄袭事件并没有引起太大关注,但随着证据越来越多被实锤,就连斯坦福大学AI实验室主任Christopher Manning也下场道歉了,表示,犯了错误就要勇于承!

同时表扬了清华大学对开源项目的贡献,而他自己对该事件毫不知情。但是有人指出,这位教授在6月3日是知道该事件的。

两位学生迫于各界压力,昨天在社交平台进行了公开道歉,但是态度并不是很诚恳。首先,他们居然使用了同样的道歉信,难道不需要仔细说明一下你在这个项目的角色、最初想法以及为什么要这么做吗?

还有一个就是甩锅,两位公开道歉的学生表示,他们只是负责该模型的社区宣传,实际写代码的是一位叫Mustafa Aljadery的。

这就更严重了,既然你们只是负责宣传,那为啥在作者栏那里加上自己的名字呢?在宣发的时候难道不验证一下论文和项目吗?并且表示对V2.5这个开源项目毫不知情。

都是成年人,既然犯错了,就应该像个爷们一样勇敢承担起来,下次改过就可以了。如果试图继续掩盖,只会越描越黑。

这个抄袭事件也折射出了我国在AI芯片制裁的大背景下对大模型开发、训练的无奈,没有超强GPU集群支撑,只能从算法、脚骨、训练数据去打磨。

同时我们的大模型开源生态也被低估了,通义千问、面壁智能、百川智能等一大批优秀的开源项目已经获得了世界的认可并迅速崛起。

本文素材来源网络、斯坦福社交平台,如有侵权请联系删除

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小米SU7车主提车一年多狂跑25万公里 登小米汽车年度总结

小米SU7车主提车一年多狂跑25万公里 登小米汽车年度总结

快科技
2026-01-01 09:15:06
刚刚!直线暴涨超100%!

刚刚!直线暴涨超100%!

证券时报e公司
2026-01-02 10:04:17
庞书令不是疯了,是在救命。她再不出声,庞家就被徐家一口吞了

庞书令不是疯了,是在救命。她再不出声,庞家就被徐家一口吞了

魔都姐姐杂谈
2025-12-29 06:29:51
名记:东契奇又胖了防守饱受诟病 湖人球迷今年就会对他失去耐心

名记:东契奇又胖了防守饱受诟病 湖人球迷今年就会对他失去耐心

罗说NBA
2026-01-02 16:36:02
5-1!勇士神级操作!谢谢你,库明加!

5-1!勇士神级操作!谢谢你,库明加!

篮球实战宝典
2026-01-01 23:57:49
湖人为何高开低走?两数据垫底成主因,雷迪克打压替补恶性循环

湖人为何高开低走?两数据垫底成主因,雷迪克打压替补恶性循环

谢说篮球
2026-01-02 17:12:46
“刺杀普京”真相揭开了?不是乌克兰,也不是欧盟,而是一旁的它

“刺杀普京”真相揭开了?不是乌克兰,也不是欧盟,而是一旁的它

岁暮的归南山
2026-01-01 16:26:14
果然不出所料,演习结束,2026刚开年,赖清德发表“获胜演讲”

果然不出所料,演习结束,2026刚开年,赖清德发表“获胜演讲”

Ck的蜜糖
2026-01-02 17:38:22
1499飞天“秒售罄”的背后:以退为进、高枕无忧的茅台…

1499飞天“秒售罄”的背后:以退为进、高枕无忧的茅台…

酩阅
2026-01-02 12:30:20
上海落下重要一“竖”:百亿元级交通工程南北通道,今天开工

上海落下重要一“竖”:百亿元级交通工程南北通道,今天开工

上观新闻
2026-01-02 07:20:08
莱昂纳德轰45分末节20分!快船6连胜擒爵士 哈登20+7李凯尔22+8

莱昂纳德轰45分末节20分!快船6连胜擒爵士 哈登20+7李凯尔22+8

罗说NBA
2026-01-02 14:03:08
轰55+11+5!被伦纳德拯救了,泰伦卢说出心里话,哈登也把话挑明

轰55+11+5!被伦纳德拯救了,泰伦卢说出心里话,哈登也把话挑明

巴叔GO聊体育
2026-01-02 17:08:19
云南电动车起火致8人死亡调查报告发布

云南电动车起火致8人死亡调查报告发布

环球网资讯
2026-01-02 14:54:08
发生了什么?港股全线大涨,商业航天超涨12%,亚太卫星暴涨38%!

发生了什么?港股全线大涨,商业航天超涨12%,亚太卫星暴涨38%!

财经智多星
2026-01-02 15:39:25
卡西尼号的最后一眼,让全人类愣住了:我们是不是宇宙唯一的傻子

卡西尼号的最后一眼,让全人类愣住了:我们是不是宇宙唯一的傻子

琉璃聊科学
2025-12-29 12:17:20
俄罗斯只剩一颗预警卫星可用?疑似丢掉两座战略核潜艇反应堆

俄罗斯只剩一颗预警卫星可用?疑似丢掉两座战略核潜艇反应堆

鹰眼Defence
2025-12-31 17:27:33
换帅如换刀!浙江迎3连胜,120秒狂追11分,球迷:感谢刘维伟师徒

换帅如换刀!浙江迎3连胜,120秒狂追11分,球迷:感谢刘维伟师徒

理工男评篮球
2026-01-02 00:11:38
河南南阳一佳人好漂亮, 身高169cm,体重50kg 美的让人移不开眼

河南南阳一佳人好漂亮, 身高169cm,体重50kg 美的让人移不开眼

东方不败然多多
2025-12-25 07:00:37
反转!于汉超、周挺进入国足原因曝光,难怪郑智会离任

反转!于汉超、周挺进入国足原因曝光,难怪郑智会离任

何老师呀
2026-01-02 16:25:24
南博又出大瓜,徐湖平落马,儿子徐湘江公司暴雷,又有人浮出水面

南博又出大瓜,徐湖平落马,儿子徐湘江公司暴雷,又有人浮出水面

蜉蝣说
2026-01-02 16:34:09
2026-01-02 18:35:00
AIGC开放社区
AIGC开放社区
AIGC开放社区是专注于AIGC(生成式人工智能)领域的开放性社区
538文章数 53关注度
往期回顾 全部

科技要闻

新势力年榜:零跑险胜华为,蔚来小鹏新高

头条要闻

政府采购项目评标委员会7名专家 其中6人"走过场"被罚

头条要闻

政府采购项目评标委员会7名专家 其中6人"走过场"被罚

体育要闻

英超离谱夜?4战全平3场0-0 曼城红军翻车

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

8200亿扩产潮下的锂电供应链之战

汽车要闻

奇瑞汽车12月销量超23万辆 全年超263万辆

态度原创

家居
手机
亲子
数码
公开课

家居要闻

无形有行 自然与灵感诗意

手机要闻

苹果、小米超额,vivo还差点,其它品牌未知

亲子要闻

这孩子以前是当领导的吧

数码要闻

内存涨价装机超预算?几个关键技巧真的能省钱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版