网易首页 > 网易号 > 正文 申请入驻

网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4

0
分享至

白交 发自 凹非寺
量子位 | 公众号 QbitAI

Llama 3首发阵容里没有的120B型号竟意外“曝光”,而且十分能打?!

最近这样一个号称是「Llama3-120b」的神秘大模型火了起来,原因在于它表现太出色了——

轻松击败GPT-4、gpt2-chatbot那种。

比如,面对像「观察希格斯场是否会改变其状态」这样的艰深难题时。

GPT-4冷酷而决绝:No;

但Llama3-120b就不一样了,“只有当我们质疑量子力学的哥本哈根解释时,让我来解释一下……”



还有就是让LIama3-120B解释笑话,并同两个gpt2-chatbot比较:im-a-good-gpt2-chatbot;im-also-a-good-gpt2-chatbot。

I randomly walked past the grave of bayes yesterday, but being a frequentist i didn’t bother taking a photo。

(昨天我偶然路过贝叶斯墓,但我是频率学派,懒得拍照。)

首先,他们三个都判断出这是关于两种统计学派的笑话,以及两个学派是相对对立的情况:
Frequentist频率学派只关注从抽样/实验的结果中提取信息,Bayesian贝叶斯学派还会设置一个主观的先验信息。

但两个gpt2-chatbot给出进一步解释是,正是因为频率学派并不认同对贝叶斯理论,所以对贝叶斯墓不感兴趣,更不会以他为荣而拍照。



而LIama3-120B精准指出笑点在“ i didn’t bother taking a photo”,并给出了更深一层的解释。

因为作为频率学派,会认为碰到贝叶斯墓的概率几乎为零。这样的小概率事件也不值得去拍照或者干一些有意义的事情。



哦莫,说的好有道理……



另外题外话,它的回答格式十分工整,让人看了赏心悦目。

除此之外,网友发现它还能创造出谷歌搜到0结果的新单词。

以及直接回答含糊的问题,不用交代背景,这不比ChatGPT好多了。

(没有说ChatGPT不好的意思)

有评测过后的网友感叹:它太聪明了,我不会再摆弄它了。因为有自己的想法



这真的是我用过最聪明的大模型了。



有网友找了半天也找不到官方来源……



与此同时,更多版本也开始出现了,比如170B、225B…嗯,一版更比一版强。



Llama 3 120B竟意外能打

这两天,社交网络上出现了各种关于Llama3 120B玩法。

比如推导解释一些理论,Omega假设。



有创造一些新单词,比如prefaceate、driftift等



并且给它一个完整的解释和定义。



甚至还有人整了个评测,去评估这个来路不明的大模型。结果在创意写作测试中成绩还不错,排名第6,超过GPT-4、Claude3-Haiku等模型。



既然如此,这个非官方的大模型Llama3 120B又是怎么来的呢?

据作者介绍,它是用MergeKit制作,将Meta官方LIama3 70B模型合并(Self-Merge)

MergeKit咋是专门用来合并预训练模型的工具包,合并可以完全在 CPU 上运行,也可以使用低至8GB的VRAM进行加速。在GitHub上已经收获3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。



△支持的合并算法

作者Maxime Labonne是一位资深机器学习专家,目前在一家通用大模型创业公司LiquidAI工作。

他博士毕业于巴黎理工学院,他在2019年开始研究大语言模型和图神经网络,并将他们应用到不同环境中,比如研发、工业、金融等,撰写过书籍《Hands-On Graph Neural Networks using Python》。



他也是开发者社区的活跃开发者,在HuggingFace上发布过各种LLM, 例如AlpahMonarch-7B、Beyonder-4x7B、Phixtral 和 NeuralBeagle14。以及一些工具,例如 LLM AutoEval、LazyMergekit、LazyZxolotl 和 AutoGGUF。

在GitHub上他的关于大模型课程,收获29.5K Star。



不过对于这个「缝合」大模型的使用,作者建议可以用来创意写作。

在多方评估中可以看到,它有时候会出现神经混乱,但写作风格不错。另外有时候还会出现拼写错误,并且非常喜欢大写字母。

而且由于觉得这个版本的推理能力比较差,于是作者再做了个225B的。



网友:看完更期待官方400B了

有网友猜测为什么LIama3-120B能这么强。

一方面,LIama3-70B自己确实很强,刚发布时就迅速跃居排行榜榜首。HuggingFace上显示,上个月下载次数就超过了27万次。



lmsysorg就深入分析了LIama3的实力,简单来说,LIama3在开放式写作和创意问题上击败了顶尖模型,但在封闭式数学和编码问题上就稍弱一点。



不过随着提示词变得更加复杂,LIama3的能力也就下降得很明显。

以及在输出内容上面,LIama3的输出比其他模型更友好,也更具对话性。



除此之外,也有网友分析这与模型深度有关。

事实上与LIama3-70B唯一的区别是额外的Layer,甚至是复制的,没有新的训练数据。。

这意味着,120B大模型的智能水平是从模型的深度产生的。“这不仅仅是训练数据的函数,它是数据和深度的结合”。



有网友尝试本地部署,Ollama上已经支持下载。网友表示:它使用48 GB VRAM + 38 GB 系统 RAM。



啊这……走了走了。



有提供GGUF形式的LMStudioAI,也很直接地说:不适合内存不足的人。



原作者也很逗趣地表示:是时候跟你的RAM做告别了。



但不管怎么说,已经在期待更多官方型号了。

比如,400B那种。



参考链接:
[1]https://x.com/spectate_or/status/1788031383052374069
[2]https://x.com/spectate_or/status/1787308316152242289
[3]https://x.com/spectate_or/status/1787295252576952325
[4]https://x.com/spectate_or/status/1787264115804606628
[5]https://huggingface.co/mlabonne/Meta-Llama-3-120B-Instruct
[6]https://x.com/maximelabonne/status/1787485038591746269
[7]https://x.com/spectate_or/status/1788102406250664171
[8]https://x.com/spectate_or/status/1787576927529615516

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
纪法底线失守,以权谋私!东莞万江街道党工委原书记被双开

纪法底线失守,以权谋私!东莞万江街道党工委原书记被双开

南方都市报
2024-05-23 18:50:18
“我哪里不好了?”凤凰男求婚遭拒,女人:我不养你们一家6口

“我哪里不好了?”凤凰男求婚遭拒,女人:我不养你们一家6口

广西秦胖胖
2024-05-22 22:56:11
杭州多名网友晒出几年前的单子,太后悔!

杭州多名网友晒出几年前的单子,太后悔!

FM93浙江交通之声
2024-05-23 08:13:28
湖南13名干部公示!

湖南13名干部公示!

大爱三湘
2024-05-23 22:03:04
“一丝不挂”新舞蹈?惹争议,被摸下体更不害臊,金星质疑是对的

“一丝不挂”新舞蹈?惹争议,被摸下体更不害臊,金星质疑是对的

吃鱼思故渊
2024-05-16 21:48:21
终于等到TRE的藤森里穂!

终于等到TRE的藤森里穂!

孤独的独角兽影视
2024-05-23 10:25:03
同学同事曝料:董宇辉上大学时很出名,新东方当老师时,非常优秀

同学同事曝料:董宇辉上大学时很出名,新东方当老师时,非常优秀

鬼菜生活
2024-05-23 19:20:48
庚欣:赖清德“台独自白”,美国怎么想?

庚欣:赖清德“台独自白”,美国怎么想?

直新闻
2024-05-22 22:42:43
NBA官宣最佳阵容:国际球星统治一阵 KD浓眉二阵詹姆斯库里三阵

NBA官宣最佳阵容:国际球星统治一阵 KD浓眉二阵詹姆斯库里三阵

罗说NBA
2024-05-23 07:58:07
私人影院暗藏服务,大尺度被曝光,老板:亲嘴、摸胸都是学生妹

私人影院暗藏服务,大尺度被曝光,老板:亲嘴、摸胸都是学生妹

看晓天下事
2024-04-11 15:31:33
大S汪小菲双双发声,回应儿子被退学,打脸张兰太尴尬!

大S汪小菲双双发声,回应儿子被退学,打脸张兰太尴尬!

古希腊掌管月桂的神
2024-05-23 13:48:29
百万粉丝网红被各平台封号:曾自称在北京有7套房,身上没8位数不出门

百万粉丝网红被各平台封号:曾自称在北京有7套房,身上没8位数不出门

极目新闻
2024-05-22 08:32:03
2个重要信号!调整尾声了?明日(5月24日)A股将重演历史

2个重要信号!调整尾声了?明日(5月24日)A股将重演历史

郭小凡财经
2024-05-23 14:44:13
“绝配结婚证”火了,新人名字让登记人员眼花:3000年修来的缘分

“绝配结婚证”火了,新人名字让登记人员眼花:3000年修来的缘分

开心果妈妈育儿间
2024-05-20 19:49:55
“我家聚餐,你是外人不配上桌”弟妹一脚把大姑姐踹下桌:你才是

“我家聚餐,你是外人不配上桌”弟妹一脚把大姑姐踹下桌:你才是

施工员小天哥
2024-05-22 22:50:38
四川轿车撞行人致5死,村民称:司机做木材生意,两个儿子是飞行员

四川轿车撞行人致5死,村民称:司机做木材生意,两个儿子是飞行员

影孖看世界
2024-05-22 14:29:01
全球第一条固态电池生产线在浙江出现,充电10分钟续航1000公里!

全球第一条固态电池生产线在浙江出现,充电10分钟续航1000公里!

我心向阳Cyy
2024-05-23 20:08:04
重大改判!中超昏哨送冠军队点球,上港获利全取3分,第3冠稳了

重大改判!中超昏哨送冠军队点球,上港获利全取3分,第3冠稳了

负角度的球
2024-05-23 17:41:13
日媒曝新垣结衣离婚!老公出轨貌美女主播,曾遭前女友控诉黑料多

日媒曝新垣结衣离婚!老公出轨貌美女主播,曾遭前女友控诉黑料多

古希腊掌管月桂的神
2024-05-22 23:18:09
警惕!高盛CEO拉响警报:美联储今年恐怕不会降息 消费者正开始控制支出

警惕!高盛CEO拉响警报:美联储今年恐怕不会降息 消费者正开始控制支出

每日经济新闻
2024-05-23 13:31:16
2024-05-24 01:04:49
量子位
量子位
追踪人工智能动态
9434文章数 175290关注度
往期回顾 全部

科技要闻

黄仁勋业绩会万字实录:我们的压力太大了

头条要闻

媒体:大陆对赖清德彻底失望 或先收回几个离岛控制权

头条要闻

媒体:大陆对赖清德彻底失望 或先收回几个离岛控制权

体育要闻

欧文,三十二而立

娱乐要闻

大S儿子被学校退学,张兰称孙子没人管

财经要闻

九鼎金租减值罗生门:郑州银行藏雷?

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

游戏
艺术
健康
房产
本地

无畏契约:凰鸣四海就在今日!FPX2-1战胜FUT拿下国际赛首胜

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

在中国,到底哪些人在吃“伟哥”?

房产要闻

信号!海南这个区域开始鼓励企业购买安居房!

本地新闻

强制措施展铁腕 “交叉执行”勇亮剑

无障碍浏览 进入关怀版