网易首页 > 网易号 > 正文 申请入驻

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

0
分享至

白交 发自 凹非寺
量子位 | 公众号 QbitAI

Llama 3首发阵容里没有的120B型号竟意外“曝光”,而且十分能打?!

最近这样一个号称是「Llama3-120b」的神秘大模型火了起来,原因在于它表现太出色了——

轻松击败GPT-4、gpt2-chatbot那种。

比如,面对像「观察希格斯场是否会改变其状态」这样的艰深难题时。

GPT-4冷酷而决绝:No;

但Llama3-120b就不一样了,“只有当我们质疑量子力学的哥本哈根解释时,让我来解释一下……”



还有就是让LIama3-120B解释笑话,并同两个gpt2-chatbot比较:im-a-good-gpt2-chatbot;im-also-a-good-gpt2-chatbot。

I randomly walked past the grave of bayes yesterday, but being a frequentist i didn’t bother taking a photo。

(昨天我偶然路过贝叶斯墓,但我是频率学派,懒得拍照。)

首先,他们三个都判断出这是关于两种统计学派的笑话,以及两个学派是相对对立的情况:
Frequentist频率学派只关注从抽样/实验的结果中提取信息,Bayesian贝叶斯学派还会设置一个主观的先验信息。

但两个gpt2-chatbot给出进一步解释是,正是因为频率学派并不认同对贝叶斯理论,所以对贝叶斯墓不感兴趣,更不会以他为荣而拍照。



而LIama3-120B精准指出笑点在“ i didn’t bother taking a photo”,并给出了更深一层的解释。

因为作为频率学派,会认为碰到贝叶斯墓的概率几乎为零。这样的小概率事件也不值得去拍照或者干一些有意义的事情。



哦莫,说的好有道理……



另外题外话,它的回答格式十分工整,让人看了赏心悦目。

除此之外,网友发现它还能创造出谷歌搜到0结果的新单词。

以及直接回答含糊的问题,不用交代背景,这不比ChatGPT好多了。

(没有说ChatGPT不好的意思)

有评测过后的网友感叹:它太聪明了,我不会再摆弄它了。因为有自己的想法



这真的是我用过最聪明的大模型了。



有网友找了半天也找不到官方来源……



与此同时,更多版本也开始出现了,比如170B、225B…嗯,一版更比一版强。



Llama 3 120B竟意外能打

这两天,社交网络上出现了各种关于Llama3 120B玩法。

比如推导解释一些理论,Omega假设。



有创造一些新单词,比如prefaceate、driftift等



并且给它一个完整的解释和定义。



甚至还有人整了个评测,去评估这个来路不明的大模型。结果在创意写作测试中成绩还不错,排名第6,超过GPT-4、Claude3-Haiku等模型。



既然如此,这个非官方的大模型Llama3 120B又是怎么来的呢?

据作者介绍,它是用MergeKit制作,将Meta官方LIama3 70B模型合并(Self-Merge)

MergeKit咋是专门用来合并预训练模型的工具包,合并可以完全在 CPU 上运行,也可以使用低至8GB的VRAM进行加速。在GitHub上已经收获3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。



△支持的合并算法

作者Maxime Labonne是一位资深机器学习专家,目前在一家通用大模型创业公司LiquidAI工作。

他博士毕业于巴黎理工学院,他在2019年开始研究大语言模型和图神经网络,并将他们应用到不同环境中,比如研发、工业、金融等,撰写过书籍《Hands-On Graph Neural Networks using Python》。



他也是开发者社区的活跃开发者,在HuggingFace上发布过各种LLM, 例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具,例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的关于大模型课程,收获29.5K Star。



不过对于这个「缝合」大模型的使用,作者建议可以用来创意写作。

在多方评估中可以看到,它有时候会出现神经混乱,但写作风格不错。另外有时候还会出现拼写错误,并且非常喜欢大写字母。

而且由于觉得这个版本的推理能力比较差,于是作者再做了个225B的。



网友:看完更期待官方400B了

有网友猜测为什么LIama3-120B能这么强。

一方面,LIama3-70B自己确实很强,刚发布时就迅速跃居排行榜榜首。HuggingFace上显示,上个月下载次数就超过了27万次。



lmsysorg就深入分析了LIama3的实力,简单来说,LIama3在开放式写作和创意问题上击败了顶尖模型,但在封闭式数学和编码问题上就稍弱一点。



不过随着提示词变得更加复杂,LIama3的能力也就下降得很明显。

以及在输出内容上面,LIama3的输出比其他模型更友好,也更具对话性。



除此之外,也有网友分析这与模型深度有关。

事实上与LIama3-70B唯一的区别是额外的Layer,甚至是复制的,没有新的训练数据。。

这意味着,120B大模型的智能水平是从模型的深度产生的。“这不仅仅是训练数据的函数,它是数据和深度的结合”。



有网友尝试本地部署,Ollama上已经支持下载。网友表示:它使用48 GB VRAM + 38 GB 系统 RAM。



啊这……走了走了。



有提供GGUF形式的LMStudioAI,也很直接地说:不适合内存不足的人。



原作者也很逗趣地表示:是时候跟你的RAM做告别了。



但不管怎么说,已经在期待更多官方型号了。

比如,400B那种。



参考链接:
[1]https://x.com/spectate_or/status/1788031383052374069
[2]https://x.com/spectate_or/status/1787308316152242289
[3]https://x.com/spectate_or/status/1787295252576952325
[4]https://x.com/spectate_or/status/1787264115804606628
[5]https://huggingface.co/mlabonne/Meta-Llama-3-120B-Instruct
[6]https://x.com/maximelabonne/status/1787485038591746269
[7]https://x.com/spectate_or/status/1788102406250664171
[8]https://x.com/spectate_or/status/1787576927529615516

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你知道为什么说“女性的私处”比马桶还要“脏”吗?

你知道为什么说“女性的私处”比马桶还要“脏”吗?

水白头
2024-06-15 11:07:02
重庆农商行女职员表白副行长后续: 单位回应 知情人爆内幕 评论破防

重庆农商行女职员表白副行长后续: 单位回应 知情人爆内幕 评论破防

妮子说美食
2024-06-16 06:53:56
御姐风!太高级!要不起的感觉

御姐风!太高级!要不起的感觉

梧州生活宝
2024-05-22 23:14:03
冷门要来了?詹俊:这届欧洲杯第一个冷门什么时候出现? 今晚么?

冷门要来了?詹俊:这届欧洲杯第一个冷门什么时候出现? 今晚么?

直播吧
2024-06-16 13:10:13
专家吐槽二本学生不尊重她演讲,遭回怼:你什么档次,我什么态度

专家吐槽二本学生不尊重她演讲,遭回怼:你什么档次,我什么态度

熙熙说教
2024-06-16 11:58:29
明天下定决心全部清仓!转融通,量化一日不取消,一日不交易

明天下定决心全部清仓!转融通,量化一日不取消,一日不交易

股海风云大作手
2024-06-16 19:00:54
欧洲杯很搞笑!镜头告诉你:瑞士前锋射门前掉下的异物是啥?

欧洲杯很搞笑!镜头告诉你:瑞士前锋射门前掉下的异物是啥?

足球大腕
2024-06-16 00:04:15
意外!申花队长夏窗确定驰援大连英博冲超,来球队月薪只有一万多

意外!申花队长夏窗确定驰援大连英博冲超,来球队月薪只有一万多

罗掌柜体育
2024-06-15 19:32:24
经济形势有多严峻?3个现象席卷中国各地,预示苦日子已开始?

经济形势有多严峻?3个现象席卷中国各地,预示苦日子已开始?

山丘楼评
2024-06-07 11:45:11
彻底炸了!周末突传利空!下周A股将下跌?

彻底炸了!周末突传利空!下周A股将下跌?

龙行天下虎
2024-06-16 14:25:24
巨亏百亿,关店11万家!昔日购物天堂,无力回天

巨亏百亿,关店11万家!昔日购物天堂,无力回天

金错刀
2024-06-14 14:28:04
陈兴汉-南京栖霞建设股份有限公司原总经理

陈兴汉-南京栖霞建设股份有限公司原总经理

户外钓鱼哥阿旱
2024-06-16 17:10:57
成都蓉城新任董事长现身客场看台,和远征球迷们一起助威

成都蓉城新任董事长现身客场看台,和远征球迷们一起助威

懂球帝
2024-06-16 18:49:10
上海女子请人上门灭白蚁崩溃:几百元就能解决,对方竟收了9000元!网友:按只收费?

上海女子请人上门灭白蚁崩溃:几百元就能解决,对方竟收了9000元!网友:按只收费?

上海圈
2024-06-15 12:38:41
中超最新积分战报:申花夺榜首,武汉三镇1-0险胜,沧州雄狮落败

中超最新积分战报:申花夺榜首,武汉三镇1-0险胜,沧州雄狮落败

足球狗说
2024-06-16 21:58:02
英国首相苏纳克和他的鞋,英国民众盯着他的脚不放了

英国首相苏纳克和他的鞋,英国民众盯着他的脚不放了

好笑娱乐君每一天
2024-06-16 08:51:39
下周一6月17日,这 4大具有爆发力板块或有望开启反攻

下周一6月17日,这 4大具有爆发力板块或有望开启反攻

惜别的海岸
2024-06-16 17:48:39
撞上了!菲野蛮冲撞中国海警,我方人员险些落海,现在开始上强度

撞上了!菲野蛮冲撞中国海警,我方人员险些落海,现在开始上强度

笔墨V
2024-06-16 12:36:50
江苏男子整理母亲遗物发现600万存单,银行:假的需要销毁

江苏男子整理母亲遗物发现600万存单,银行:假的需要销毁

丹宝说文史
2023-07-08 20:21:44
两性疑问:为什么男生更喜欢从后面来

两性疑问:为什么男生更喜欢从后面来

坟头长草
2024-05-30 16:33:38
2024-06-16 22:12:49
量子位
量子位
追踪人工智能动态
9538文章数 175382关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

健康
手机
本地
亲子
公开课

晚餐不吃or吃七分饱,哪种更减肥?

手机要闻

后置双蔡司认证镜头 + 双色温闪光灯,vivo V40 手机海外发布

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

亲子要闻

小姨呸了8个月的外甥一口,接下来外甥让小姨明白,谁才是大哥

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版