网易首页 > 网易号 > 正文 申请入驻

性能碾压Llama 2,全球下载量超500万,百川智能开源模型凭什么?

0
分享至

本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。

作者|漠影

编辑|三北

随着“百模大战”进入小考时刻,已经有国产大模型交高分卷了。

9月1日,网信办深度合成服务算法备案公告一声令下,国内头部大模型纷纷面向全社会开放服务,接受新的考验。

正值此时,有一个国产开源大模型已经横扫各大中英文测评榜单,不仅在基座模型测试中碾压Llama 2等开源大模型,还在垂直行业领域远超其他开源模型,展现出“黑马”之势。

据官方数据显示,在GitHub、Hugging Face等知名开源社区,这一模型的8月下载超300万,达到全球同类开源模型最高,可以说成为了全球最受欢迎的GPT-4平替之一。

更值得一提的是,这一模型的研发团队还率先开放了模型训练过程,连复旦大学计算科学技术学院教授张奇等都盛赞其“为学术界做出了巨大贡献”。

9月6日,由搜狗创始人王小川创办的公司——百川智能——推出Baichuan 2大模型,同时公布了前文提到的最新进展。王小川说:“Llama2开源模型时代已经过去了,我们(开发者)现在可以获得更友好且能力更强的开源模型。”

国产大模型正在改写产业的游戏规则。作为首批开放大模型的企业之一,百川智能最新发布的Baichuan 2大模型实测性能如何?300万/月下载量背后是什么样的战略和行动布局?透过百川大模型的200多天实践,我们能看到国产大模型什么样的破局逻辑?

9月13日,通过对话百川智能技术联创陈炜鹏,智东西对此进行了深入探讨。

Baichuan 2下载地址:
https://github.com/baichuan-inc/Baichuan2

01.

月下载超300万
测评全面碾压Llama 2

随着“百模大战”进入深水区,当下大模型进行简单对话已不足为奇,还要追求“文理兼修”。

百川智能于9月6日新推出的Baichuan 2开源模型,不仅文科能力大幅提高,其在数学能力、代码能力、安全能力、逻辑、语义理解都有明显的提升。陈炜鹏告诉智东西,无论是在MMLU、CMMLU、BBH等综合性基准测评中,还是在GSM8k、HumanEval等垂直领域的测评中,抑或是多语言能力测评中,Baichuan 2都远超同类开源大模型。

▲Baichuan 2相比于一代Baichuan的能力提升

在所有主流中英文通用榜单上,Baichuan 2全面领先Llama 2,而Baichuan2-13B在测评中秒杀所有同尺寸开源模型。

▲Baichuan 2在通用领域的测评成绩

在垂直行业测评榜单中,Baichuan2-13B在法律、数学、医疗领域的模型效果均优于其他开源模型。

▲Baichuan 2在垂直领域的测评成绩

在跨语言能力测评榜单中,Baichuan2-13B在英语、法语、阿拉伯语、俄语中的能力都超过其它开源模型。

▲Baichuan 2在多语言领域的测评成绩

IDEA研究院讲席科学家张家兴参与了百川智能最新的发布会,他在会上的圆桌峰会中称:“国内做大模型的团队也很多,能做到Baichuan 2这样效果的还是很少。”实际上,当下很多大模型测评是围绕单点维度进行的,甚至大家看到GPT-4在某些榜单中已经排到了10名往后,其实意义不大。而百川大模型公布了全面性的测评结果,相对更具有说服力。

“除了榜单,场景实测更重要。”陈炜鹏告诉智东西,“目前Baichuan在开源社区总下载量已经超过500万次,月下载量达到300多万次。”

▲Baichuan大模型在开源社区的下载情况

据悉,已有200+企业申请百川大模型开源商用授权,并已将百川模型投入实际生产场景。申请企业涵盖互联网、软件和信息技术、金融、法律、教育、制造、企业服务等众多领域,合作伙伴群体仍在持续扩大。

可以看到,不仅全面刷榜权威基准,百川智能开源大模型在各行各业已经加速落地。

02.

直击商业协议“隐痛”
国产大模型要改变游戏规则

陈炜鹏告诉智东西,采用Baichuan 2,开发者不仅能够得到直接的效果提升,还能够获得更多实际的便利。

比如很多开发者为Llama 2的商业协议所困,迁移到Baichuan 2则可以避开不少“隐痛”。

Llama 2的商用协议对中国开发者并不友好。虽然宣称开源,但其商用协议声明“仅适用于英文为主的环境”。也就是说,如果你做的模型更多是商用于中文场景,是拿不到开源协议的。

▲Llama 2的商业协议部分内容

对此,Baichuan 2面向中文领域全面开放,且在多语言环境中提供免费服务。陈炜鹏告诉智东西,对于迁移到Baichuan 2的开发者来说,不仅模型效果得以提升,迁移成本也更低。Llama 2等模型所依赖的推理、加速、调优等套件,其中超70%的套件Baichuan 2都同等支持,剩下30%则是不常用的。

直击商业协议“隐痛”,国产大模型厂商正试图改变硅谷主导的游戏规则。

王小川在Baichuan 2的发布会上说:“Llama 2开源模型的时代已经过去了。我们现在可以获得比Llama更友好且能力更强的开源模型,能够帮助扶持中国整个生态的发展。”

为了构建大模型生态,9月6日,百川智能率先开放了其大模型训练过程,助力伙伴在理解训练过程的基础上做微调和强化;同时其设立了大模型科研基金,通过跟CCF(中国计算机学会)的合作,在今年内会大约投入300~400万人民币支持高校项目开发;此外,其还与AWS合作开展了黑客马拉松活动,面向开发者提供算力支持,以鼓励其进行大模型应用的开发。

在国内开源社区建设方面,Baichuan大模型不仅在GitHub、Hugging Face等国际开源社区中上线,最新的Baichuan 2也已经上线了国内的魔塔社区、昇思社区等知名AI社区,壮大本土AI大模型开源生态。

03.

全球大模型“乱斗”
百川智能200天“蝶变”

当下,全球AI大模型产业正进入“乱斗”阶段。

这厢,微软将与OpenAI的“铁联盟”关系搁置一边,转而搭上Llama 2等开源模型;那厢,Meta也传出明年要训练对标GPT-3.5的闭源大模型,同时Anthropic、A21 Labs等创企也紧锣密鼓,想要在全行业AI化的浪潮中分一杯羹。

在国内,从自主可控和数字化转型需求出发,“百模大战”已经打响近半年。知名行研机构IDC预测,2026年中国AI大模型市场规模将达到211亿美元,互联网大厂、AI创企、传统行业龙头企业纷纷加入了大模型角逐,计划有朝一日做出赶超GPT-4的大模型。

诚然,GPT-4仍然是一堵高墙,但其早已不是业内唯一选择。国内的开源大模型已经在更多需要私有化部署、轻量化应用和自主可控技术的场景,填补空缺位置。

百川智能正是率先抓住了这样的市场空缺机遇,在过去的200多天里探索“蝶变”。

按照百川智能创立之初的计划,其预计在2023年三季度推出500亿规模参数的模型,四季度发布对标GPT-3.5的模型,在2024年一季度的时候发布超级应用。

实际上,团队一方面顺利执行原计划,另一方面开辟了开源路线——在二季度发现中国有开源模型的需求,于是从6月开始以平均每月一次的频率发布了开源模型,免费开源了7B、13B不同尺寸的大模型。

为什么能够如此快速反应,且迭代如此之快?

陈炜鹏向智东西道出背后的一个关键要点:百川智能将搜索的经验快速迁移到大模型的研发中。回顾大模型的训练过程,陈炜鹏解读道,这就类似一个“造火箭”系统化工程。对于百川智能团队来说,这与其熟悉的搜索研发模式有相似之处,将复杂的系统做拆解,通过过程评估来推动团队的协同,显著提升团队的效果。

在技术方面,大模型和搜索有很多重合的技术栈,比如在大模型训练中关键的数据环节,团队基于搜索经验实现数据精选和处理,数据处理环节实现千亿数据的小时级去重,并通过多粒度内容质量打分提升大模型质量。正是基于这种精细构造的数据,百川智能采用了开源最大的2.6T语料训练7B/13B的模型。在模型研发的过程中,百川也探索了基于自己数据的scaling law(比例定律),实现了高效、稳定、可预测。

据悉,团队在千卡的A800集群里面达到180TFLOPS的训练性能,使得机器利用率超过50%,在行业中间也处于最高水平之一。而跳出模型训练本身来说,通过多次迭代并通过开源社区反馈,百川智能不断提升Baichuan大模型的竞争力,也同时为闭源大模型的开发提供助力。

04.

结语:从闭源到开源
国产AI大模型加速突破

“百模大战”狂飙200天,目前已进入了阶段性“交卷”时刻。国内不仅有大厂的闭源大模型产品面向全社会开放,也有AI创企如百川智能研发的开源大模型获得了权威测评、开发者社区和行业客户的多方面认可。

虽然GPT-4依然强势,但国内开源大模型已经能够进行部分替代。在私有化部署、轻量化应用及自主可控要求高的场景中,以Baichuan 2为代表的大模型找到市场空缺,快速行动。

与此同时,相比于ChatGPT强调的语言对话能力,国内大模型在数学、逻辑、代码等领域都在加速突破。这些能力代表着大模型要真正摆脱“幻觉”,从而开拓着更广阔的潜在市场。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
英国对五家中国实体实施制裁

英国对五家中国实体实施制裁

未来半导体
2024-06-17 09:37:58
港珠澳大桥爆重大设计问题!

港珠澳大桥爆重大设计问题!

港港地
2024-06-17 10:03:35
被喷到自闭:扬言《黑神话》辱女的女记者已隐藏推特

被喷到自闭:扬言《黑神话》辱女的女记者已隐藏推特

游民星空
2024-06-17 16:05:12
扎克伯格为父亲庆生,全家齐聚造价23亿的超级游艇,华裔妻很惹眼

扎克伯格为父亲庆生,全家齐聚造价23亿的超级游艇,华裔妻很惹眼

译言
2024-06-17 09:45:19
太狂妄了!澳智库:将仁爱礁破船变废弃油田,美日韩澳四国入驻

太狂妄了!澳智库:将仁爱礁破船变废弃油田,美日韩澳四国入驻

王子看台海
2024-06-16 17:59:13
终于明白父亲节存在感低的原因,网友评论,既真实又扎心

终于明白父亲节存在感低的原因,网友评论,既真实又扎心

娱乐洞察点点
2024-06-17 13:52:24
怎么会有这么邋遢的女艺人

怎么会有这么邋遢的女艺人

刘空青
2024-06-16 20:06:28
魔兽世界:网易确认开服时间,正式服同步更新,这些账号有望解封

魔兽世界:网易确认开服时间,正式服同步更新,这些账号有望解封

胖哥游戏说
2024-06-17 16:48:49
一个人如把一个肉体凡胎当成神一样崇拜,那这个世界就真没救了!

一个人如把一个肉体凡胎当成神一样崇拜,那这个世界就真没救了!

雪莉故事汇
2024-06-17 08:43:26
上港喜讯!奥斯卡不回巴西,无球队接盘,中超最大牌球星有望留队

上港喜讯!奥斯卡不回巴西,无球队接盘,中超最大牌球星有望留队

国足风云
2024-06-17 16:38:50
中国将把澳大利亚纳入单方面免签国家

中国将把澳大利亚纳入单方面免签国家

和讯网
2024-06-17 13:02:14
喜讯!国足新归化猛将即将到位 中场短板迎刃而解 世预赛出线有戏

喜讯!国足新归化猛将即将到位 中场短板迎刃而解 世预赛出线有戏

零度眼看球
2024-06-17 07:23:22
大帝在瑞士峰会前一天说的,是显示自己生气、不怕,也为真谈铺垫

大帝在瑞士峰会前一天说的,是显示自己生气、不怕,也为真谈铺垫

邵旭峰域
2024-06-17 11:03:57
网红柏公子被封禁后首露面,化浓妆打扮时髦,同村人曝其被封原因

网红柏公子被封禁后首露面,化浓妆打扮时髦,同村人曝其被封原因

鑫鑫说说
2024-06-17 11:30:16
害怕舆论影响,三元里商户和租户开始拒绝采访,但有房东是真急了

害怕舆论影响,三元里商户和租户开始拒绝采访,但有房东是真急了

映射生活的身影
2024-06-17 12:31:00
税务倒查30年?公开回应来了!税务到底可以倒查企业多少年?

税务倒查30年?公开回应来了!税务到底可以倒查企业多少年?

学税
2024-06-17 09:42:16
苏州将破5000亿,佛山大跌37%!2024年1-4月出口城市20强排行出炉

苏州将破5000亿,佛山大跌37%!2024年1-4月出口城市20强排行出炉

水又木二
2024-06-17 13:16:50
普京:如果乌克兰放弃加入北约,俄罗斯将立即停火

普京:如果乌克兰放弃加入北约,俄罗斯将立即停火

花非花008
2024-06-14 21:54:14
陈奕迅因伤治疗延期佛山演唱会,主办方公布补偿方案

陈奕迅因伤治疗延期佛山演唱会,主办方公布补偿方案

南方都市报
2024-06-17 16:44:04
《黑神话悟空》被女权组织索要顾问费?外网玩家:这下不得不买了

《黑神话悟空》被女权组织索要顾问费?外网玩家:这下不得不买了

叶子猪游戏网
2024-06-17 14:56:41
2024-06-17 19:12:49
智东西
智东西
聚焦智能变革,服务产业升级。
8614文章数 116489关注度
往期回顾 全部

科技要闻

为什么你的iPhone,肯定用不上"苹果AI"?

头条要闻

银行原董事长和代行长联手 勾结准90后大股东挪走26亿

头条要闻

银行原董事长和代行长联手 勾结准90后大股东挪走26亿

体育要闻

豪华阵容,原始战术 英格兰10亿天团就这?

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

定了!退休人员基本养老金上调3%

汽车要闻

传奇新篇章 全新一代大众迈腾来了

态度原创

旅游
亲子
家居
公开课
军事航空

旅游要闻

游客放狗进赛里木湖追天鹅,景区回应!

亲子要闻

中韩双胞胎萌娃四岁了!感谢阿姨奶奶的陪伴,给你们拍组照片看看

家居要闻

研己实景 古典与现代的交融

公开课

近视只是视力差?小心并发症

军事要闻

内塔尼亚胡宣布战时内阁已解散

无障碍浏览 进入关怀版