网易首页 > 网易科技 > IT业界 > 正文

王小川的百川智能发布开源中英文大模型,清华北大率先使用

0
分享至

6月15日消息,王小川新创业公司百川智能,推出70亿参数量的中英文预训练大模型——baichuan-7B。目前这款大模型已在Hugging Face、Github以及Model Scope平台发布。

公司CEO王小川表示:“本次开源模型的发布是百川智能成立2个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B模型,不仅能为中国的AGI事业添砖加瓦,也为世界大模型开源社区贡献了新的力量。”

据了解,baichuan-7B在C-Eval、AGIEval和Gaokao三个中文评估基准进行了综合评估。

在中文C-EVAL的评测中,baichuan-7B的综合评分达到了42.8分,超过了ChatGLM-6B的38.9分。

C-Eval评测基准由上海交通大学、清华大学以及爱丁堡大学联合创建,是面向中文语言模型的综合考试评测集,覆盖了52个来自不同行业领域的学科。

在AGIEval的评测里,baichuan-7B综合评分达到34.4分,超过LLaMa-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他开源模型。

AGIEval评测基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包含了中国的高考、司法考试,以及美国的SAT、LSAT、GRE和GMAT等20个公开且严谨的官方入学和职业资格考试。

在GAOKAO评测中,baichuan-7B的综合评分达到了36.2分,领先于同参数规模的各种其他预训练模型。

GAOKAO评测基准是复旦大学研究团队创建的评测框架,以中国高考题目作为数据集,用于测试大模型在中文语言理解和逻辑推理能力方面的表现。

此外baichuan-7B在英文上表现同样亮眼。在MMLU的评测中baichuan-7B综合评分高达42.5分,领先英文开源预训练模型LLaMA-7B的34.2分以及中文开源模型ChatGLM-6B的36.9分。

MMLU由加州大学伯克利分校等知名高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的57个科目,主要目标是对模型的英文跨学科专业能力进行深入测试。其内容广泛,从初级水平一直涵盖到高级专业水平。

百川智能介绍称,训练语料对大模型的训练结果至关重要。在构建预训练语料库方面,公司以高质量中文语料为基础,同时融合了优质的英文数据。在数据质量方面,通过质量模型对数据进行打分,对原始数据集进行篇章级和句子级的精确筛选;在内容多样性方面,利用自研超大规模局部敏感哈希聚类系统和语义聚类系统,对数据进行了多层次多粒度的聚类,最终构建了包含1.2万亿token的兼顾质量和多样性的预训练数据。相较于其他同参数规模的开源中文预训练模型,数据量提高了超过50%。

在万亿优质中英文数据的基础上,为了更好地提升训练效率,baichuan-7B深度整合了模型算子来加快计算流程,并针对任务负载和集群配置,自适应优化了模型并行策略以及重计算策略。通过高效的训练过程调度通信,baichuan-7B成功地实现了计算与通信的高效重叠,进而达到了超线性的训练加速,在千卡集群上训练吞吐达到180+Tflops的水平。

同时,已有的开源模型窗口长度在2K以内,对于一些长文本建模任务,如需要引入外部知识做搜索增强的场景,更长的处理长度有助于模型在训练与推理阶段捕获越多的上下文信息,2K的处理长度存在比较大的制约。baichuan-7B基于高效的attention算子优化实现了万级别超长动态窗口的扩张能力,本次开源的预训练模型开放了4K上下文窗口,使模型应用场景更加广泛。

此外,baichuan-7B还对模型训练流程进行了深度优化,采用了更科学且稳定的训练流程和超参数选择,使得baichuan-7B模型的收敛速度大大提升。与同等参数规模的模型相比,baichuan-7B在困惑度(PPL)和训练损失(training loss)等关键性能指标上表现更加优秀。

百川智能称,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。

baichuan-7B此次开源的内容包含了推理代码、INT4量化实现、微调代码,以及预训练模型的权重。其中,微调代码方便用户对模型进行调整和优化;推理代码与INT4量化实现则有助于开发者低成本地进行模型的部署和应用;预训练模型权重开源后,用户则可以直接使用预训练模型进行各种实验研究。

据了解,北京大学和清华大学两所顶尖大学已率先使用baichuan-7B模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B模型的应用和发展。(易科)

延伸阅读
相关推荐
热点推荐
“新冠疫苗之父”落马,荣誉清零!打过三针的网友慌了

“新冠疫苗之父”落马,荣誉清零!打过三针的网友慌了

胡严乱语
2025-12-07 15:51:07
再反转!助理辟谣姜昆没出国,网友曝飞机上合照,这次又社死

再反转!助理辟谣姜昆没出国,网友曝飞机上合照,这次又社死

知法而形
2025-12-26 23:23:24
广东1分险胜北京,杨溢28+6+5率队取胜,杜锋满意

广东1分险胜北京,杨溢28+6+5率队取胜,杜锋满意

老牛体育解说
2025-12-27 21:52:43
他们为何急于注销携程?

他们为何急于注销携程?

智识漂流
2025-12-25 20:09:36
美国盯上印度,共同介入台海,莫迪向中方表态:台海和印度无关?

美国盯上印度,共同介入台海,莫迪向中方表态:台海和印度无关?

东方点兵
2025-12-28 04:10:03
可惜了:中超传奇球星踢业余比赛,曾被国足冷落,已不复当年之勇

可惜了:中超传奇球星踢业余比赛,曾被国足冷落,已不复当年之勇

国足风云
2025-12-27 15:51:14
刑满释放人员任职国有控股企业“高管” ,企业陷困境 一负责人回应:我也正被调查

刑满释放人员任职国有控股企业“高管” ,企业陷困境 一负责人回应:我也正被调查

红星新闻
2025-12-27 17:43:24
冯忠华看望高祀仁、黄华华、朱小丹、林树森、张广宁等老同志

冯忠华看望高祀仁、黄华华、朱小丹、林树森、张广宁等老同志

新京报政事儿
2025-12-27 21:39:39
被网友的“空气炸锅用法”惊到了!打开思路后,根本闲置不了

被网友的“空气炸锅用法”惊到了!打开思路后,根本闲置不了

室内设计师有料儿
2025-12-27 11:41:48
国民党中央委员改选,连胜武首次参与;侯友宜投票后,表态很微妙

国民党中央委员改选,连胜武首次参与;侯友宜投票后,表态很微妙

现代小青青慕慕
2025-12-27 18:42:20
南京这把火,直烧到了北京一位“通天“人物的心坎上

南京这把火,直烧到了北京一位“通天“人物的心坎上

鹤羽说个事
2025-12-24 15:00:47
50岁的阿姨一样可以把粉色裙子穿出既减龄又不会显得装嫩的效果

50岁的阿姨一样可以把粉色裙子穿出既减龄又不会显得装嫩的效果

美女穿搭分享
2025-12-26 16:54:05
准备开抢!国王5条大鱼入市:湖人盯上数人+小萨或成勇士交易关键

准备开抢!国王5条大鱼入市:湖人盯上数人+小萨或成勇士交易关键

锅子篮球
2025-12-27 21:14:50
2026年元旦起!身份证=老年证,全国老人免办新证,7大福利刷证就能享

2026年元旦起!身份证=老年证,全国老人免办新证,7大福利刷证就能享

阿芒娱乐说
2025-12-27 17:08:42
帕金斯:詹姆斯的肢体语言透露出沮丧,他与湖人的关系已到尽头

帕金斯:詹姆斯的肢体语言透露出沮丧,他与湖人的关系已到尽头

懂球帝
2025-12-27 20:20:08
必须得到格陵兰!特朗普下令强取,全欧洲炸锅,北极一夜成火药桶

必须得到格陵兰!特朗普下令强取,全欧洲炸锅,北极一夜成火药桶

叮当当科技
2025-12-27 14:25:36
71岁王健林,突传消息!

71岁王健林,突传消息!

台州交通广播
2025-12-27 22:26:28
莱万:巴萨曾要求我不要再进球,以避免支付给拜仁额外的奖金!

莱万:巴萨曾要求我不要再进球,以避免支付给拜仁额外的奖金!

篮球看比赛
2025-12-27 12:20:08
日本今年逾2万种食品涨价 明年初再涨近3600种

日本今年逾2万种食品涨价 明年初再涨近3600种

财联社
2025-12-26 21:21:09
钱再多有啥用?70岁身价千亿的比尔盖茨,还是要为23岁女儿操碎心

钱再多有啥用?70岁身价千亿的比尔盖茨,还是要为23岁女儿操碎心

瓜汁橘长Dr
2025-12-27 14:39:12
2025-12-28 05:47:00

科技要闻

小米也涨价了!业界称终端再不涨明年必亏

头条要闻

美媒:特朗普显然触及了中国的红线 中方怒了

头条要闻

美媒:特朗普显然触及了中国的红线 中方怒了

体育要闻

83分钟绝杀!曼城2-1年度收官:英超6连胜狂飙

娱乐要闻

张昊唯逃税涉黄风波落幕:法院认定朋友造谣

财经要闻

注意,开始拉物价了!

汽车要闻

好音响比大屏更重要?车企开始“听”用户的

态度原创

数码
游戏
房产
教育
公开课

数码要闻

美国法官裁定苹果公司智能手表可继续在美销售

我真幸运:《泰拉瑞亚》1.4.5更新定档1月份!

房产要闻

年销20亿+!中交·蓝色港湾用好房子致敬好生活

教育要闻

家长对于孩子正向的反馈太缺少了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×