网易首页 > 网易号 > 正文 申请入驻

斯坦福两学生抄袭清华系大模型,是如何被发现的?对话打假者

0
分享至

一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息,近日在海内外引发热议。北京时间4日凌晨,该团队的两名成员Siddharth Sharma和Aksh Garg在社交媒体X上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。

据悉,两人是斯坦福大学计算机科学专业的本科生,自称在团队中的角色是模型推广,而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后,他们要求Mustafa提供原创性证明和训练代码,但未取得任何证据。

4日,南都记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。

针对此事,面壁智能CEO李大海也作出回应,称技术创新不易,呼吁共建开放、合作、有信任的社区环境。

用不到500美元训练出超越SOTA水平的大模型?

事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近100倍,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。

Llama3-V团队声称训练出一个超越SOTA(意为“最新技术”的最佳状态)水平的多模态大型模型,性能比肩多家。

更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上三位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。

不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个“令人震惊”的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项Llama3-V涉嫌抄袭的证据。

比如在模型结构和配置文件上,二者高度雷同,只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5,仅做了一些重新格式化和变量重命名,包括但不限于图像切片、分词器、重采样器、数据加载等变量。

网友晒出Llama3-V涉嫌抄袭的证据。

GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、Gemini Pro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。

南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友Magic Yang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。

后来他注意到,Llama3-V项目在HuggingFace上排名也非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V 2.5的项目主页。

这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。

杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。

“连错的都一模一样”,确信是套壳

南都记者注意到,6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。

据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”

刘知远的回应。

针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不易,好的成果希望被更多人关注和认可,但不是以这种方式。”李大海呼吁,大家共建开放、合作、有信任的社区环境。

刘知远也表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。这次开源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作为语言模型基座。

“开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。”同时他提到,Llama3-V团队的三位作者中,有两位是斯坦福大学本科生,未来还有很长的路,“如果知错能改,善莫大焉”。

北京时间4日凌晨,卷入此次风波的两名斯坦福大学本科生Siddharth Sharma和Aksh Garg在社交平台上解释,称该项目由三人发布,他们只在其中帮忙推广模型,负责代码编写的是Mustafa Aljadery。事发后,他们曾尝试联系Mustafa发布原创性声明,并提供训练代码,但到目前为止还未看到任何证据。在这份联合声明中,两人再次向原作者道歉,并称对未尽职尽责确保Llama3-V的独创性而感到失望,现已将所有对Llama3-V的引用都删除了。

两人联合发文道歉。

被推为主要责任方的Mustafa,是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学,主攻深度学习和数学,是一名软件工程师。截至目前,Mustafa尚未发声。

两名作者的解释,尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为,称两人借口推脱,是拒不认错的表现。

此番随着原创者也下场打假,这场大模型抄袭风波将暂告一段落。

采写:南都记者李玲 发自北京

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
举人、秀才、榜眼、探花、进士、状元,相当于今天的什么学位?

举人、秀才、榜眼、探花、进士、状元,相当于今天的什么学位?

历史人文2
2026-05-27 11:00:03
李显龙访华后划清界限:在商言商不是共同族群,别把我们当自己人

李显龙访华后划清界限:在商言商不是共同族群,别把我们当自己人

叹为观止易
2026-05-28 01:32:34
家业:直到田荣华沦为清鹤仙人的通房丫头,才懂李景东自尽多蠢

家业:直到田荣华沦为清鹤仙人的通房丫头,才懂李景东自尽多蠢

慢半拍sir
2026-05-27 21:29:17
兹维列夫3-0碾压捷克名将,世界第3连胜6局闯入法网32强,太牛了

兹维列夫3-0碾压捷克名将,世界第3连胜6局闯入法网32强,太牛了

凌空倒钩
2026-05-28 06:00:24
宏远速递!朱芳雨表态,徐杰与女友在韩国度假,广东接触状元内线

宏远速递!朱芳雨表态,徐杰与女友在韩国度假,广东接触状元内线

多特体育说
2026-05-27 22:49:31
日本新生代最漂亮的女神,今田美樱一眼便让人心生欢喜

日本新生代最漂亮的女神,今田美樱一眼便让人心生欢喜

情感大头说说
2026-05-28 00:36:03
黄仁勋有“分身”了?辽宁小伙穿皮衣拿显卡,播放量破百万!

黄仁勋有“分身”了?辽宁小伙穿皮衣拿显卡,播放量破百万!

雷科技
2026-05-27 18:54:20
夏窗首签?曝巴萨与25岁英格兰国脚达成全面协议!已报价7000万欧

夏窗首签?曝巴萨与25岁英格兰国脚达成全面协议!已报价7000万欧

我爱英超
2026-05-27 22:52:16
认清A股的本质,才能在股市里赚到钱

认清A股的本质,才能在股市里赚到钱

东方豪侠
2026-05-26 10:32:49
真主党无人机突袭重创以军401装甲旅

真主党无人机突袭重创以军401装甲旅

风铃草语
2026-05-28 06:16:49
杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

照见古今
2026-03-26 19:06:28
“指纹锁”退出中国家庭?开锁师傅说了实话,我连夜换回了铁将军

“指纹锁”退出中国家庭?开锁师傅说了实话,我连夜换回了铁将军

巢客HOME
2026-04-08 15:48:09
蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

北海史记
2026-05-25 15:49:23
看了韩国人疯抢法拉利,我才明白:中国这波AI红利,全让他们吃了

看了韩国人疯抢法拉利,我才明白:中国这波AI红利,全让他们吃了

大佬灼见
2026-05-25 14:56:46
新华社下场了!

新华社下场了!

燕梳楼频道
2026-05-27 13:48:33
45家首都国企面向市民开放

45家首都国企面向市民开放

新京报
2026-05-27 10:33:56
熟人杀熟能过分到什么程度?网友:亲戚看见我都绕道走

熟人杀熟能过分到什么程度?网友:亲戚看见我都绕道走

另子维爱读史
2026-05-28 07:58:34
搞笑图片第1227期:终于知道霸总吃饭时看菜单的感觉了

搞笑图片第1227期:终于知道霸总吃饭时看菜单的感觉了

今天的快乐
2026-05-27 21:30:20
000509,三连板后辟谣,大股东精准减持

000509,三连板后辟谣,大股东精准减持

大众证券报
2026-05-27 21:37:49
几月份退休最划算、几月份退休最吃亏,很有讲究,选错月份真吃亏

几月份退休最划算、几月份退休最吃亏,很有讲究,选错月份真吃亏

细说职场
2026-05-27 18:42:58
2026-05-28 08:47:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
613654文章数 3588797关注度
往期回顾 全部

头条要闻

台媒:特朗普就台湾问题表态后 没人敢提“台独”了

头条要闻

台媒:特朗普就台湾问题表态后 没人敢提“台独”了

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

一线调查丨燃油车“甩卖”也难卖

科技要闻

拼多多股价跌10%:管理层称业绩难免波动

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

家居
房产
手机
健康
教育

家居要闻

古老而持久 石影扶手椅

房产要闻

合生创展前总裁被查!直指房企违规放贷、利益输送等问题

手机要闻

苹果开发“防抢夺锁机”功能 被抢走的iPhone将立即自动上锁

打外泌体会比干细胞更安全吗

教育要闻

下周天就高考了,刷到的一定考的全会蒙的全对!

无障碍浏览 进入关怀版