网易首页 > 网易号 > 正文 申请入驻

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

0
分享至

[雷峰网]两周前,面壁发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。激活参数仅 39B,支持 64k 上下文,相比 Llama3速度更快、可处理更长文本。


图注:面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中,刷新开源大模型推理性能 SOTA。


图注:面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B,超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b,以及闭源模型 GPT-3.5-turbo。

Eurux-8x22B 由 Mistral-8x22B对齐而来。强劲战斗力,来自面壁 Ultra 对齐技术上新UltraInterat 大规模、高质量对齐数据集。此前,面壁 Ultra 对齐系列数据集已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

Eurux-8x22B模型+对齐数据集,全家桶开源:

https://github.com/OpenBMB/Eurus

https://huggingface.co/openbmb/Eurux-8x22b-nca

开源大模型「理科状元」开源大模型「理科状元」

复杂推理能力是体现大模型性能差异的最核心能力之一,也是大模型真正落地应用所需的关键能力所在。

Eurux-8x22B在代码和数学等复杂推理的综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA,堪称「理科状元」。特别在 LeetCode (180道LeetCode真题)和 TheoremQA(美国大学水准的STEM题目)这两个具有挑战性的基准测试中,超过现有开源模型。


图注:Eurux-8x22B 在代码和数学等复杂推理综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA。

开源大模型「理科状元」Eurux-8x22B在实际应用中表现如何呢?

在近期LeetCode 周赛,这一检验人类程序员编程能力的真实竞技场上:Eurux-8x22B 在 Python 编程方面取得综合排名超越了80% 的人类参赛选手的优秀成绩,成功解决四道算法题中的三道,可以初步通过互联网大厂的程序员编程面试。

下面是本次周赛中Eurux-8x22B对一道中等难度的算法题的真实解答:



除了代码能力优秀,Eurux-8x22B解答数学题也是轻而易举。

例如给它一道高中排列组合题,Eurux-8x22B 首先给出了清晰的解题思路,然后一步步地拆解执行,再进行结果汇总,最后得到正确答案。



再考察它一道代数题,Eurux-8x22B 直击要害,运用二项式定理,清晰简洁地给出了正确的解答。


接着给它一道向量代数题,Eurux-8x22B 也能轻松拿下。


高考函数题可能是令很多人回忆起来就头疼的一类题,Eurux-8x22B 也能解答无误。


(需要说明的是,Eurux-8x22B 没有针对中文语料进行额外的微调和对齐!)


面壁 Ultra 对齐技术,大模型上分神器!

本次大模型「理科状元」 Eurux-8x22B 的优异表现,得益于来自面壁 Ultra 对齐技术的大规模、高质量对齐数据集UltraInteract上新。

好数据,才有好模型。此前,面壁 Ultra 对齐技术已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

➤UltraInterat对齐数据集地址:

?https://github.com/OpenBMB/Eurus

UltraInteract是专门设计用于提升大模型推理能力的大规模、高质量的对齐数据集,包含了覆盖数学、代码和逻辑推理问题的12个开源数据集的86K条指令和220K偏好对,共有五十万(条)左右数据。相比而言,LLaMA 3-70B模型则是使用了千万量级的对齐数据,这从侧面证明了 UltraInteract 数据集的优质性——数据质量胜过数据数量。UltraInteract 数据集开源后在社区受到了广泛好评。




从领先的端侧模型「小钢炮」MiniCPM,到开源模型推理新 SOTA 的Eurux-8x22B,为什么面壁智能总能推出同等参数、性能更优的「高效大模型」?答案是,大模型是一项系统工程,而面壁作为国内极少数兼具大模型算法与 infra 能力的团队,拥有自研的全流程高效生产线:面壁 Ultra 对齐技术、Infra 工艺、独家「模型沙盒」实验和现代化数据工厂,从数据、训练到调校工艺环环相扣,一条优秀的大模型Scaling Law增长曲线由此而生。

Infra工艺方面,面壁构建了全流程优化加速工具套件平台ModelForce,可以实现 10 倍推理加速,90% 成本降低。


算法方面,通过上千次以上的「模型沙盒」实验,探索更加科学的训模方法。以小见大,寻找高效模型训练配置,实现模型能力快速形成。



➤Eurux-8x22B模型GitHub地址:

https://github.com/OpenBMB/Eurus

➤Eurux-8x22B模型HuggingFace地址:https://huggingface.co/openbmb/Eurux-8x22b-nc

➤UltraInterat对齐数据集地址:

https://github.com/OpenBMB/Eurus

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
森林北家境曝光,新疆中产,父亲旅游协会副会长,母亲咏春拳讲师

森林北家境曝光,新疆中产,父亲旅游协会副会长,母亲咏春拳讲师

娱小小新
2024-05-20 17:00:36
华润系“金融少将”突然落马,曾在华润银行、华润资产任要职

华润系“金融少将”突然落马,曾在华润银行、华润资产任要职

南方都市报
2024-05-22 10:48:23
专家:对俄战争已然失败

专家:对俄战争已然失败

俄罗斯卫星通讯社
2024-01-22 15:13:11
后续来了!男子试鞋被认为弄脏鞋,买完单后就烧鞋,工作人员回复

后续来了!男子试鞋被认为弄脏鞋,买完单后就烧鞋,工作人员回复

伊印
2024-05-21 16:36:08
618高端手机销量TOP 10榜单公布:华为占据六席

618高端手机销量TOP 10榜单公布:华为占据六席

PChome电脑之家
2024-05-22 12:01:28
王毅外长发出统一强音后,赖清德派亲信喊话大陆,望两岸恢复对话

王毅外长发出统一强音后,赖清德派亲信喊话大陆,望两岸恢复对话

镇远校尉
2024-05-21 18:14:20
“小宝马5系大跳水”!从40万直降至21万,还看啥奔驰C!

“小宝马5系大跳水”!从40万直降至21万,还看啥奔驰C!

搞笑先生的日记本
2024-05-21 12:20:58
美媒:法国支持国际刑事法院寻求对以色列领导人发出逮捕令,脱离西方盟友立场

美媒:法国支持国际刑事法院寻求对以色列领导人发出逮捕令,脱离西方盟友立场

环球网资讯
2024-05-21 10:53:18
网红王红权星、鲍鱼家姐账号被封,知情者曝原因:炫富带坏风气

网红王红权星、鲍鱼家姐账号被封,知情者曝原因:炫富带坏风气

180°视角
2024-05-22 00:02:33
5月,大批会计集体离职!2024,会计正式成为“高危”工作!

5月,大批会计集体离职!2024,会计正式成为“高危”工作!

祥顺财税俱乐部
2024-05-20 09:02:54
患癌6年后再确诊白血病,48岁叙利亚第一夫人:逆境中坚守的“沙漠玫瑰”

患癌6年后再确诊白血病,48岁叙利亚第一夫人:逆境中坚守的“沙漠玫瑰”

红星新闻
2024-05-21 22:34:37
比法国队还强!欧洲杯大热官宣!3大金球巨星+8人过亿,近乎夺冠

比法国队还强!欧洲杯大热官宣!3大金球巨星+8人过亿,近乎夺冠

阿泰希特
2024-05-22 14:33:09
医院通知退核酸检测费市民怀疑是诈骗,医院回应:是真的

医院通知退核酸检测费市民怀疑是诈骗,医院回应:是真的

观威海
2024-05-21 09:48:29
邓超,你怎么回事,等着回家跪娘娘的搓衣板吧!

邓超,你怎么回事,等着回家跪娘娘的搓衣板吧!

娱乐八卦木木子
2024-05-21 23:01:43
申花锋线迎来久违的新强援,下一轮踢深圳新鹏城首发,马莱莱替补

申花锋线迎来久违的新强援,下一轮踢深圳新鹏城首发,马莱莱替补

评球论事
2024-05-22 12:23:04
赖昌星案发后感叹:如果“二哥”没出事,谁也不敢动我!二哥是谁

赖昌星案发后感叹:如果“二哥”没出事,谁也不敢动我!二哥是谁

纸鸢奇谭
2023-08-20 10:03:04
尹力率中共代表团访问塞尔维亚

尹力率中共代表团访问塞尔维亚

新京报
2024-05-22 15:20:13
王昊落马,真的与骆马湖有关?

王昊落马,真的与骆马湖有关?

仕道
2024-05-22 11:39:43
无锡比亚迪:员工集体罢工,AI抢加班时间,打工人被机器人取代

无锡比亚迪:员工集体罢工,AI抢加班时间,打工人被机器人取代

大风文字
2024-05-21 06:53:26
中植系的销售,不退40亿被抓了

中植系的销售,不退40亿被抓了

大猫财经Pro
2024-05-21 19:52:48
2024-05-22 18:52:49
雷峰网
雷峰网
关注智能与未来!
64112文章数 655118关注度
往期回顾 全部

科技要闻

微软给用户更多理由回到 Windows

头条要闻

19岁女孩订婚数天后投河自杀:彩礼27万 她一直想退婚

头条要闻

19岁女孩订婚数天后投河自杀:彩礼27万 她一直想退婚

体育要闻

官方:橡树资本接管国米 8年苏宁时代结束

娱乐要闻

乔欣助理离职大爆料!涉及明星超10位

财经要闻

理想不再“理想”

汽车要闻

舒适价值拉满 奇瑞风云T9售12.99-16.99万元

态度原创

亲子
教育
本地
手机
公开课

亲子要闻

婴儿2万一个,5百一两,她们在小X书买卖婴儿,还能砍价打折…

教育要闻

“高考倒计时 过得好快”你还记得当年那个意气风发的自己吗

本地新闻

强制措施展铁腕 “交叉执行”勇亮剑

手机要闻

iPhone 16 Pro Max首发全新窄边框技术:屏占比创苹果新高

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版