网易首页 > 新闻中心 > 新闻 > 正文

性能超越开源模型标杆Llama2-70B,书生·浦语大模型InternLM-20B开源发布

0
分享至

9月20日,商汤科技与上海人工智能实验室联合香港中文大学和复旦大学正式推出书生·浦语大模型InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发。

同时,书生·浦语面向大模型研发与应用的全链条工具链全线升级,与InternLM-20B一同继续全面开放,向企业和开发者提供免费商用授权。

自今年6月首次发布以来,书生·浦语已经历多轮升级,在开源社区和产业界产生了广泛影响。InternLM-20B模型性能先进且应用便捷,以不足三分之一的参数量,达到了当前被视为开源模型标杆的Llama2-70B的能力水平。

代码库链接:https://github.com/InternLM/InternLM

魔搭社区链接:https://modelscope.cn/organization/Shanghai_AI_Laboratory

书生·浦语“增强版”:增的不只是量

相比于国内社区之前陆续开源的7B和13B规格的模型,20B量级模型具备更为强大的综合能力,在复杂推理和反思能力上尤为突出,因此对于实际应用能够带来更有力的性能支持。

另一方面,20B量级模型可以在单卡上进行推理,经过低比特量化后,可以运行在单块消费级GPU上,给实际使用带来很大的便利。

InternLM-20B是基于2.3T Tokens预训练语料从头训练的中量级语言大模型。相较于InternLM-7B,训练语料经过了更高水平的多层次清洗,补充了高知识密度和用于强化理解及推理能力的训练数据。

在理解能力、推理能力、数学能力、编程能力等考验语言模型技术水平的方面,InternLM-20B与此前已开源模型相比,性能显著增强:优异的综合性能,通过更高水平的数据清洗和高知识密度的数据补充,以及更优的模型架构设计和训练,显著提升了模型的理解、推理、数学与编程能力。

InternLM-20B全面领先量级相近的开源模型,使之以不足三分之一的参数量,评测成绩达到了被视为开源模型的标杆Llama2-70B水平。

· 拥有强大的工具调用能力,实现大模型与现实场景的有效连接,并具备代码解释和反思修正能力,为智能体(Agent)的构建提供了良好的技术基础;

· 支持更长语境,支持长度达16K的语境窗口,更有效地支撑长文理解、长文生成和超长对话,长语境同时成为支撑在InternLM-20B之上打造智能体(Agent)的关键技术基础;

· 具备更安全的价值对齐,书生·浦语团队对InternLM-20B进行了基于SFT(监督微调)和RLHF(基于人类反馈的强化学习方式)两阶段价值对齐以及专家红队的对抗训练,当面对带有偏见的提问时,它能够给出正确引导。

基于OpenCompass的InternLM-20B及相近量级开源模型测评结果

全链条工具体系再巩固:各环节全面升级

今年7月,商汤科技与上海AI实验室联合发布书生·浦语的同时,在业内率先开源了覆盖数据、预训练、微调、部署和评测的全链条工具体系。

历经数月升级,书生·浦语全链条开源工具体系巩固升级,并向全社会提供免费商用。

全面升级的全链条工具体系

数据-OpenDataLab开源“书生·万卷”预训练语料

书生·万卷是开源的多模态语料库,包含文本数据集、图文数据集、视频数据集三部分,数据总量超过2TB。

目前,书生·万卷1.0已被应用于书生·多模态、书生·浦语的训练,为模型性能提升起到重要作用。

预训练-InternLM高效预训练框架

除了大模型外,InternLM仓库也开源了预训练框架InternLM-Train。深度整合了Transformer模型算子,使训练效率得到提升,并提出了独特的Hybrid Zero技术,使训练过程中的通信效率显著提升,实现了高效率千卡并行,训练性能达行业领先水平。

微调-InternLM全参数微调、XTuner轻量级微调

InternLM支持对模型进行全参数微调,支持丰富的下游应用。同时,低成本大模型微调工具箱XTuner也在近期开源,支持多种大模型及LoRA、QLoRA等微调算法。

通过XTuner,最低仅需8GB显存即可对7B模型进行低成本微调,在24G显存的消费级显卡上就能完成20B模型的微调。

部署-LMDeploy支持十亿到千亿参数语言模型的高效推理

LMDeploy涵盖了大模型的全套轻量化、推理部署和服务解决方案,支持了从十亿到千亿级参数的高效模型推理,在吞吐量等性能上超过FasterTransformer、vLLM和Deepspeed等社区主流开源项目。

评测-OpenCompass一站式、全方位大模型评测平台

OpenCompass大模型评测平台构建了包含学科、语言、知识、理解、推理五大维度的评测体系,支持超过50个评测数据集和30万道评测题目,支持零样本、小样本及思维链评测,是目前最全面的开源评测平台。

自7月发布以来,受到学术界和产业界广泛关注,目前已为阿里巴巴、腾讯、清华大学等数十所企业及科研机构广泛应用于大模型研发。

应用-Lagent轻量灵活的智能体框架

书生·浦语团队同时开源了智能体框架,支持用户快速将一个大语言模型转变为多种类型的智能体,并提供典型工具为大语言模型赋能。

Lagent集合了ReAct、AutoGPT 及ReWoo等多种类型的智能体能力,支持智能体调用大语言模型进行规划推理和工具调用,并可在执行中及时进行反思和自我修正。

基于书生·浦语大模型,目前已经发展出更丰富的下游应用,将于近期陆续向学术及产业界分享。

面向大模型掀起的新一轮创新浪潮,商汤科技坚持原创技术研究,通过前瞻性打造新型人工智能基础设施,建立大模型及研发体系,持续推动AI创新和落地,引领人工智能进入工业化发展阶段,同时赋能整个AI社区生态的繁荣发展。

全链条工具体系开源链接:

“书生·万卷”预训练语料

https://github.com/opendatalab/WanJuan1.0

InternLM预训练框架

https://github.com/InternLM/InternLM

XTuner微调工具箱

https://github.com/InternLM/xtuner

LMDeploy推理工具链

https://github.com/InternLM/lmdeploy

OpenCompas大模型评测平台

https://github.com/open-compass/opencompass

Lagent智能体框架

https://github.com/InternLM/lagent

相关推荐
热点推荐
要知道早上尽量不要破气

要知道早上尽量不要破气

冬天来旅游
2024-05-23 18:34:20
官宣!中国女排名单做出调整,小钢炮重获启用,最美二传意外离队

官宣!中国女排名单做出调整,小钢炮重获启用,最美二传意外离队

吾爱女排
2024-05-23 19:53:32
中国为何迟迟不武统台湾?美专家说出的一番话,令全场鸦雀无声

中国为何迟迟不武统台湾?美专家说出的一番话,令全场鸦雀无声

刘刘大顺
2024-02-26 10:05:05
惊!法国成功试射携带核弹头的ASMPA导弹,全球震惊

惊!法国成功试射携带核弹头的ASMPA导弹,全球震惊

亡海中的彼岸花
2024-05-23 07:53:18
他们不会想到几十年后的同胞会来为侵略者庆祝!

他们不会想到几十年后的同胞会来为侵略者庆祝!

吴女士
2024-05-04 12:47:19
我目前为止最佩服两个人:一个是汪峰。另一个是贾跃亭。

我目前为止最佩服两个人:一个是汪峰。另一个是贾跃亭。

股票短线实盘指导操作
2024-05-23 09:09:01
《庆余年2》看到赖御史被杖毙,才懂二皇子李承泽为何向范闲示好

《庆余年2》看到赖御史被杖毙,才懂二皇子李承泽为何向范闲示好

空白剧场KB
2024-05-23 18:55:08
戛纳红毯,唐嫣的A4腰,关晓彤的高开衩,都败给了网红带来的震撼

戛纳红毯,唐嫣的A4腰,关晓彤的高开衩,都败给了网红带来的震撼

白宸侃片
2024-05-22 08:36:44
张兰到底有没有造谣孙子退学?胡律师硬刚大S!内地法院不会受理

张兰到底有没有造谣孙子退学?胡律师硬刚大S!内地法院不会受理

娱小小新
2024-05-23 16:17:13
解放军第13军开赴前线,全军从3万多人加强到了近7万人

解放军第13军开赴前线,全军从3万多人加强到了近7万人

玲子瑜伽健身
2024-05-23 09:45:04
小米集团一季度总营收人民币755亿元

小米集团一季度总营收人民币755亿元

北京商报
2024-05-23 19:16:06
广东3名现任区委书记(区党工委书记)被查

广东3名现任区委书记(区党工委书记)被查

新京报
2024-05-22 12:52:03
1973年出生,社保交了15年,退休拿到养老金后,彻底懵了

1973年出生,社保交了15年,退休拿到养老金后,彻底懵了

懂保汇大沈哥
2024-05-09 11:19:18
著名相声演员李建华病逝,他生前有两大遗憾,让人感慨泪目

著名相声演员李建华病逝,他生前有两大遗憾,让人感慨泪目

娱乐的小灶
2024-05-23 18:34:00
古代被翻牌子的妃子,第二日为何要别人搀扶?老太监笑着道出原因

古代被翻牌子的妃子,第二日为何要别人搀扶?老太监笑着道出原因

小影的娱乐
2024-05-23 18:11:59
姚明微笑给杨鸣颁奖!辽宁球迷口号很搞笑,最后还参与辽篮大合影

姚明微笑给杨鸣颁奖!辽宁球迷口号很搞笑,最后还参与辽篮大合影

嘴炮体坛
2024-05-22 22:37:39
外媒:匈牙利部长称,国际刑事法院申请对以色列领导人逮捕令“不可接受”,匈牙利不执行

外媒:匈牙利部长称,国际刑事法院申请对以色列领导人逮捕令“不可接受”,匈牙利不执行

环球网资讯
2024-05-23 20:41:23
闹大了!专家呼吁:房价下跌30%到40%,重归理性合理区间

闹大了!专家呼吁:房价下跌30%到40%,重归理性合理区间

林子说事
2024-05-23 22:28:39
暴增4万家!中国最“苦”生意,为何成了广东赚钱王?

暴增4万家!中国最“苦”生意,为何成了广东赚钱王?

金错刀
2024-05-22 18:24:30
头部券商A股投行业绩集体“跳水” 中金、广发港股IPO承销逆风翻盘

头部券商A股投行业绩集体“跳水” 中金、广发港股IPO承销逆风翻盘

21世纪经济报道
2024-05-23 21:03:04
2024-05-24 05:04:49

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

体育要闻

欧文,三十二而立

娱乐要闻

大S儿子被学校退学,张兰称孙子没人管

财经要闻

九鼎金租减值罗生门:郑州银行藏雷?

科技要闻

黄仁勋业绩会万字实录:我们的压力太大了

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

亲子
手机
数码
艺术
公开课

亲子要闻

这一瞬间,她又变成了小时候的模样

手机要闻

vivo S19系列再次被确认:三款版本,能打过OPPO Reno12系列吗?

数码要闻

苹果未来将推出可折叠MacBook Pro 内置M5芯片

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版
×