网易首页 > 网易号 > 正文 申请入驻

零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新

0
分享至

机器之心报道

机器之心编辑部

在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。

在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、34B 三个版本,采用 Apache 2.0 许可证。



  • GitHub 地址:https://github.com/01-ai/Yi-1.5
  • Hugging Face 模型下载地址:https://huggingface.co/01-ai

据了解,Yi-1.5 是 Yi-1.0 的持续预训练版本,使用 500B 个 token 来提高编码、推理和指令执行能力,并在 300 万个指令调优样本上进行了精细调整。

刚一发布,就已经有开发者跃跃欲试:



并收获了好评:



与前序模型相比,Yi-1.5 系列模型进一步提升了编码、数学、推理和指令遵循能力。从下方多个基准测试结果可以看出,Yi-1.5 34B 型号的一些指标超过了 Qwen 的 72B,几乎与 Meta Llama 3 的 70B 相当。6B 和 9B 型号也成功超越了 Mistral 的 7B v0.2 版和 Gemma 的 7B 型号。









重磅消息当然不止这一个。

在成立一周年之际,零一万物宣布面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。



Yi 大模型 API 开放平台 (https://platform.lingyiwanwu.com/)

其中,千亿参数规模的 Yi-Large API 具备超强文本生成及推理性能,适用于复杂推理、预测,深度内容创作等场景,每百万 token 的价格是 20 元,是 GPT-4-turbo 的三分之一。



Yi-Large-Turbo API 则根据性能和推理速度、成本,进行了平衡性高精度调优,适用于全场景、高品质的推理及文本生成等场景。Yi-Medium API 优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景;如果需要超长内容文档相关应用,也可以选用 Yi-Medium-200K API,一次性解读 20 万字不在话下;Yi-Vision API 具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景;Yi-Spark API 则聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。

其中特别要提到的是发布会现场正式亮相的千亿参数 Yi-Large 闭源大模型。Yi-Large 面世的同时即正式进军全球 SOTA 顶级大模型之首。可以看到,与 GPT-4、Claude3 Sonnet、Gemini 1.5 Pro 以及 Llama 3-70B-Instruct 等当前顶级模型的较量中,Yi-Large 在绝大多数情况下取得了优势。



同时,在斯坦福大模型排行榜 AlpacaEval 的英语评测中,Yi-Large 达到全球大模型 Win Rate 第一。在中文通用大模型综合性基准 SuperCLUE 的中文语言理解排名中,Yi-Large 一跃成为国产大模型 No. 1。



中文能力方面,SuperCLUE 更新的四月基准表现中,Yi-Large 也位列国产大模型之首,Yi-Large 的综合中英双语能力皆展现了卓越的性能。

在发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中,仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4-0409 等国际厂商的最新旗舰模型互有胜负。



Yi-XLarge 初期训练中评测(2024 年 5 月 12 日)。

至此,零一万物已经建立了「双轨模型策略」。



近期上线的一站式 AI 工作站「万知」(wanzhi.com/ 微信小程序「万知 AI」)则是零一万物基于世界领先的闭源模型 Yi-Large 所做出的「模应一体」生产力应用。



而对于大众和行业最关心的「大模型落地如何产生价值」的命题,李开复指出,国内大模型赛道的竞跑从狂奔到长跑,终局发展将取决于各个选手如何有效达到「TC-PMF」(
Product-Market-Technology-Cost Fit,技术成本 X 产品市场契合度)。大模型从训练到服务都很昂贵,算力紧缺是赛道的集体挑战,行业应当共同避免陷入不理性的 ofo 式流血烧钱打法,让大模型能够用健康良性的 ROI 蓄能长跑。

在李开复博士看来,自研 AI Infra 是零一万物必然要走的路,零一万物也自成立起便将 AI Infra 设立为重要方向,着力于实现计算效率的优化。AI Infra(AI Infrastructure 人工智能基础架构技术)主要涵盖大模型训练和部署提供各种底层技术设施。这也基于一个既定事实,很多大模型公司没有美国大厂的 GPU 数量,因此要采取更务实的战术和战略。

零一万物着力于实现计算效率的优化,经过多方面优化后,零一万物千亿参数模型的训练成本同比降幅达一倍之多。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2-3!日本女排两度领先崩盘,世联赛排名更新:中国女排利好

2-3!日本女排两度领先崩盘,世联赛排名更新:中国女排利好

天涯沦落人
2024-05-28 22:04:38
俄罗斯宣布进入紧急状态,巨亏之下俄天然气公司生产洗衣机自救

俄罗斯宣布进入紧急状态,巨亏之下俄天然气公司生产洗衣机自救

史政先锋
2024-05-28 21:00:36
向太设宴邀关之琳李连杰等大咖,郭碧婷儿子被团宠,长得像混血儿

向太设宴邀关之琳李连杰等大咖,郭碧婷儿子被团宠,长得像混血儿

娱絮
2024-05-27 16:36:24
女子电子厂上班晒真实收入:工作28天日均12个小时,工资到手发了6300多块

女子电子厂上班晒真实收入:工作28天日均12个小时,工资到手发了6300多块

六子吃凉粉
2024-05-28 13:50:46
今夏第一笔重磅转会❓迪马济奥:接替姆巴佩!巴黎已1亿欧报价K77

今夏第一笔重磅转会❓迪马济奥:接替姆巴佩!巴黎已1亿欧报价K77

直播吧
2024-05-28 22:08:10
赴韩参会不访韩,只待一天就匆匆回国,中国的态度,日韩读懂了吗

赴韩参会不访韩,只待一天就匆匆回国,中国的态度,日韩读懂了吗

小豆豆赛事
2024-05-28 16:47:27
孙春兰,访问意大利

孙春兰,访问意大利

意讯
2024-05-28 20:35:00
王菲为李嫣庆祝18岁生日,母女抱头灿笑,李亚鹏为女儿准备大礼

王菲为李嫣庆祝18岁生日,母女抱头灿笑,李亚鹏为女儿准备大礼

素素娱乐
2024-05-28 07:11:06
湖北一股民3.5元抄底兰州银行,被套后死扛9个月亏损24万割肉离场

湖北一股民3.5元抄底兰州银行,被套后死扛9个月亏损24万割肉离场

股海风云大作手
2024-05-28 17:46:07
昆凌罕晒三胎正面照,2岁妹妹干家务好软萌,嘴唇微翘超像周杰伦

昆凌罕晒三胎正面照,2岁妹妹干家务好软萌,嘴唇微翘超像周杰伦

娱絮
2024-05-27 20:32:36
霍启刚三兄弟罕同框,出席装修公司开业,36岁霍启仁帅气稳重!

霍启刚三兄弟罕同框,出席装修公司开业,36岁霍启仁帅气稳重!

古希腊掌管月桂的神
2024-05-28 19:37:38
55岁恒立体育董事长饶俊跳楼身亡,跳楼地点曝光,妻儿悲痛欲绝

55岁恒立体育董事长饶俊跳楼身亡,跳楼地点曝光,妻儿悲痛欲绝

180°视角
2024-05-28 13:52:02
退休8年,69岁省监狱管理局原局长落马,老上级曾指使假“中纪委干部”刑讯逼供

退休8年,69岁省监狱管理局原局长落马,老上级曾指使假“中纪委干部”刑讯逼供

鲁中晨报
2024-05-28 15:58:06
巴萨即将官宣!弗里克来了:签约2年,若夺双冠奖金175万

巴萨即将官宣!弗里克来了:签约2年,若夺双冠奖金175万

叶青足球世界
2024-05-28 20:15:26
李湘携女儿回北京,深山内拜访艺术大师,合影曝光王诗龄很谦卑

李湘携女儿回北京,深山内拜访艺术大师,合影曝光王诗龄很谦卑

缘浅娱深
2024-05-28 17:07:22
中国正式回复泽连斯基,若他继续假装听不懂,普京恐不会再手软了

中国正式回复泽连斯基,若他继续假装听不懂,普京恐不会再手软了

千里持剑
2024-05-28 16:58:30
上海婚姻登记处回应离婚预约爆满,“与楼市新政无关”

上海婚姻登记处回应离婚预约爆满,“与楼市新政无关”

南方都市报
2024-05-28 17:53:13
暴跌96%!阿里一季度净利不足10亿元,跟腾讯的419亿拉开差距了

暴跌96%!阿里一季度净利不足10亿元,跟腾讯的419亿拉开差距了

知道宏观
2024-05-28 14:30:30
3-1!女排爆大冷:亚洲冠军大爆发,进攻虐对手64分,中国迎考验

3-1!女排爆大冷:亚洲冠军大爆发,进攻虐对手64分,中国迎考验

知轩体育
2024-05-28 19:07:45
一面两吃!天虹一战,妻离子散...

一面两吃!天虹一战,妻离子散...

金石随笔
2024-05-28 00:39:31
2024-05-29 02:20:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
9027文章数 141933关注度
往期回顾 全部

科技要闻

4月中国手机需求回升 iPhone出货量增长52%

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

体育要闻

克莱伯:我希望能够出战G4 我的状态将在热身后决定

娱乐要闻

昆凌晒三胎正面照,2岁妹妹超像周杰伦

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

三联屏/纯电续航318km 岚图FREE 318官图发布

态度原创

教育
艺术
手机
家居
军事航空

教育要闻

【中招咨询】一文看懂北京八中教育集团招生政策!

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

手机要闻

华为三喜临门:折叠屏市场领跑,畅享70S配置清晰,系统焕新升级

家居要闻

圆的世界 流动的曲线与自如的空间

军事要闻

以军装甲部队进入加沙地带南部城市拉法市中心

无障碍浏览 进入关怀版