网易首页 > 网易号 > 正文 申请入驻

不到500美元训练出超水平大模型?

0
分享至

  图片由腾讯元宝AI生成。

  一则斯坦福大学Llama3-V团队抄袭清华系大模型的消息,近日引发热议。北京时间4日凌晨,该团队的两名成员在社交媒体上对这一学术不端行为公开致歉,并表示会将Llama3-V模型悉数撤下。

  据悉,两人是斯坦福大学计算机科学专业的本科生,自称在团队中的角色是模型推广,而负责该项目代码编写的是毕业于南加利福尼亚大学Mustafa Aljadery。事发后,他们要求Mustafa提供原创性证明和训练代码,但未取得任何证据。

  南都记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。

  斯坦福大学AI团队发布模型被指抄袭  

  事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近99%,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。

  更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上3位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。

  不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个令人震惊的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项涉嫌抄袭的证据。

  比如在模型结构和配置文件上,二者高度雷同,只是变量名不同。Llama3-V的代码也几乎完全照抄MiniCPM-Llama3-V 2.5,仅做了一些重新格式化和变量重命名,包括但不限于图像切片、分词器、重采样器、数据加载等变量。

  GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、Gemini Pro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。 

  对话打假者:发现抄袭不难 证实不易 

  南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友Magic Yang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。

  后来他注意到,Llama3-V项目在HuggingFace上排名非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V 2.5的项目主页。

  这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。

  杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。

  “连错的都一模一样”,确信是套壳  

  6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。

  据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”

  针对此事,面壁智能CEO李大海也发文称,深表遗憾。“技术创新不易,好的成果希望被更多人关注和认可,但不是以这种方式。”李大海呼吁,大家共建开放、合作、有信任的社区环境。

  刘知远也表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA(意为“最新技术”的最佳状态)的肩上持续前进。“开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。”同时他提到,Llama3-V团队的3位作者中,有两位是斯坦福大学本科生,未来还有很长的路,“如果知错能改,善莫大焉”。

  北京时间4日凌晨,卷入此次风波的两名斯坦福大学本科生在社交平台上解释,称该项目由3人发布,他们只在其中帮忙推广模型,负责代码编写的是Mustafa Aljadery。事发后,他们曾尝试联系Mustafa发布原创性声明,并提供训练代码,但到目前为止还未看到任何证据。在这份联合声明中,两人再次向原作者道歉,并称对未尽职尽责确保Llama3-V的独创性而感到失望,现已将所有对Llama3-V的引用都删除了。

  被推为主要责任方的Mustafa,是团队中唯一的全职成员。其本硕毕业于南加利福尼亚大学,主攻深度学习和数学,是一名软件工程师。截至目前,Mustafa尚未发声。

  两名作者的解释,尚不能平息质疑。斯坦福人工智能实验室主任Christopher David Manning公开发文谴责这一抄袭行为,称两人借口推脱,是拒不认错的表现。  

  面壁智能核心团队来自清华NLP实验室  

  此次被牵涉进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室 (THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。

  今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。

  后续进展  

  6月5日,面壁智能发布消息称,作为开源社区的贡献者和受益者,面壁智能,OpenBMB&清华NLP实验室认真讨论决定,将面壁“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,并且企业、个人在填写问卷登记后亦允许商业使用,社区使用MiniCPM系列模型需要遵循Apache 2.0和《MiniCPM模型社区许可协议》。

  采写:南都记者 李玲 林文琪

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

老谢谈史
2026-03-18 18:33:35
台统一方案或出乎意料:若美国发动代理人战争,中国将启天津模式

台统一方案或出乎意料:若美国发动代理人战争,中国将启天津模式

独坐山巅前
2026-04-04 01:41:45
伊朗媒体:苏莱曼尼女儿否认他的亲属在美被捕

伊朗媒体:苏莱曼尼女儿否认他的亲属在美被捕

财联社
2026-04-05 06:19:45
一女子爬山扭到脚,因思想保守不愿让男消防员搀扶下山,最终被5名消防员用担架抬下山

一女子爬山扭到脚,因思想保守不愿让男消防员搀扶下山,最终被5名消防员用担架抬下山

最金华
2026-04-04 22:40:48
印度一名政府女雇员在家中遭性侵,嫌犯以讨要饮用水为由进入住所,实施性侵后将其双手捆绑,并进行殴打和折磨,警方正全力抓捕嫌犯

印度一名政府女雇员在家中遭性侵,嫌犯以讨要饮用水为由进入住所,实施性侵后将其双手捆绑,并进行殴打和折磨,警方正全力抓捕嫌犯

潇湘晨报
2026-04-04 14:50:12
郑丽文访问大陆前,连胜文公开提醒“谨言慎行”,赖清德气急败坏

郑丽文访问大陆前,连胜文公开提醒“谨言慎行”,赖清德气急败坏

南宗历史
2026-04-05 12:23:01
一夜之间,非北京球迷都成了足球规则专家,国安到底得罪了谁?

一夜之间,非北京球迷都成了足球规则专家,国安到底得罪了谁?

体坛鉴春秋
2026-04-05 10:48:47
绝不走委内瑞拉的老路,中国无视特朗普威胁,紧急援助运抵古巴

绝不走委内瑞拉的老路,中国无视特朗普威胁,紧急援助运抵古巴

闻香阁
2026-04-05 08:08:39
篮球巨星深陷嫖娼风波,对方特殊身份令人咋舌,到底真相几何?

篮球巨星深陷嫖娼风波,对方特殊身份令人咋舌,到底真相几何?

干史人
2026-03-30 22:05:03
修理工来家修水管,进门一脸好奇:你家装修和楼上一模一样

修理工来家修水管,进门一脸好奇:你家装修和楼上一模一样

清茶浅谈
2025-04-05 22:30:05
53岁菲戈:我每周去健身房锻炼两三次,跑八到十公里两三次

53岁菲戈:我每周去健身房锻炼两三次,跑八到十公里两三次

懂球帝
2026-04-03 10:06:10
烟火伴锋芒,深情渡余生!张雪峰的爱情故事很浪漫

烟火伴锋芒,深情渡余生!张雪峰的爱情故事很浪漫

史海流年号
2026-04-03 08:25:33
与辉同行致歉,自费千万先行垫付退款

与辉同行致歉,自费千万先行垫付退款

映射生活的身影
2026-04-03 08:50:09
医美女王翻车!偷税47.55亿被罚,换血骗局遭曝光,更多黑料被扒

医美女王翻车!偷税47.55亿被罚,换血骗局遭曝光,更多黑料被扒

潮鹿逐梦
2026-04-03 16:09:46
暴雨、大暴雨、大风!假期出行,紧急提醒

暴雨、大暴雨、大风!假期出行,紧急提醒

环球网资讯
2026-04-05 07:34:09
赵心童10-1希金斯!改写34年历史,与世界第1争冠,决赛胜率100%

赵心童10-1希金斯!改写34年历史,与世界第1争冠,决赛胜率100%

球场没跑道
2026-04-05 08:58:12
清明前后,这8种蔬菜不要买?菜贩子的“真心话”到底该不该信

清明前后,这8种蔬菜不要买?菜贩子的“真心话”到底该不该信

江江食研社
2026-04-04 20:30:08
随着北京国安1-2,青岛海牛1-0,中超最新积分榜出炉

随着北京国安1-2,青岛海牛1-0,中超最新积分榜出炉

凌空倒钩
2026-04-04 18:11:44
1955 年饶漱石遭开除党籍,历多年关押服刑,晚年于农场度余生

1955 年饶漱石遭开除党籍,历多年关押服刑,晚年于农场度余生

唠叨说历史
2026-03-24 11:17:11
毛主席钢笔字的惊艳之作,书法界大揭秘!

毛主席钢笔字的惊艳之作,书法界大揭秘!

书画相约
2026-04-03 08:51:56
2026-04-05 13:19:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
604855文章数 3587929关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

专家:美国对伊朗发动战争是本世纪最大战略失误之一

头条要闻

专家:美国对伊朗发动战争是本世纪最大战略失误之一

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

旅游
房产
亲子
健康
时尚

旅游要闻

注意!百里杜鹃景区预约已达饱和

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

亲子要闻

这女孩不简单

干细胞抗衰4大误区,90%的人都中招

女人不管多大年纪衣服不要随便穿,这些穿搭可借鉴,优雅显瘦

无障碍浏览 进入关怀版