网易首页 > 网易号 > 正文 申请入驻

智谱AI推出ChatGLM3大模型!44项测试国内排名第一

0
分享至

本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。

作者 | 李水青
编辑 | 云鹏

智东西10月27日报道,今日,在2023中国计算机大会(CNCC)上,智谱AI CEO张鹏宣布,智谱AI推出第三代基座大模型ChatGLM3及相关系列产品。

这是智谱AI继推出千亿基座的对话模型ChatGLM和ChatGLM2之后的又一次重大突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。

基于ChatGLM3,智谱AI全新上线了“智谱清言”,国内首推代码交互能力,支持图像处理、数学计算、数据分析等多个场景,张鹏在现场对这些能力进行了实时演示。

张鹏透露,最新版本的ChatGLM-turbo在最新AgentBench上已略超出GPT-3.5。在算力方面,ChatGLM3已支持昇腾、海光DCU等10余种国产硬件生态;考虑更多边缘侧需求,ChatGLM3提供1.5B、3B等更丰富的模型尺寸,支持在笔记本电脑、手机、汽车上部署。

在开源生态方面,智谱AI将对话ChatGLM3-6B、长文本ChatGLM3-6B-32k、多模态CogVLM-17B、智能体AgentLM开源。

此外,面向企业级市场,智谱AI开放平台推出私有模型方案、专属模型方案、开放模型方案多种选择,据称ChatGLM-turbo的API价格下降50%。

一、ChatGLM3评测排名首位,新功能瞄向GPT-4V

ChatGLM3发布,是智谱AI今年来第三次对ChatGLM基座模型进行了深度优化。智谱AI采用了多阶段增强预训练方法、更丰富的训练数据和更优的训练方案,使ChatGLM3-6B具备更强大的性能。

1. 更强大性能,44项测试国内排名第一

测评显示,ChatGLM3在44个中英文公开数据集测试中国内同尺寸模型排名首位,其中,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。

2. 瞄向GPT-4V,四大技术升级

瞄向GPT-4V,ChatGLM3 本次实现了若干全新功能的迭代升级,包括:

(1)多模态理解能力的CogVLM,看图识语义,在10余个国际标准图文评测数据集上取得SOTA。
(2)代码增强模块Code Interpreter,根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务。
(3)网络搜索增强WebGLM,接入搜索增强,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。
(4)ChatGLM3的语义能力与逻辑能力大大增强。

3、更高效推理,速度提升2~3倍

ChatGLM3实现了更高效的推理,ChatGLM3通过高效动态推理和显存优化技术的应用,相较于目前最佳开源实现vLLM速度提升2~3倍。

4、 全新Agent智能体能力,比二代提高100倍

针对近期讨论更火热的AI Agent能力,ChatGLM3采用全新Agent智能体算法,充分激活大模型智能体能力,在智能规划和执行方面,相比ChatGLM二代提高1000%。

智谱AI还开启国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

二、与GPT-3.5平齐,全面适配国产硬件生态

张鹏透露,最新版本的ChatGLM-turbo在最新AgentBench上和GPT-3.5平齐,甚至略有超出。

智谱AI很早就高度关注到算力问题,布局全面适配国产硬件生态,以保证算力安全。

据悉,自2022年初,GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。当前其已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。

考虑更多边缘侧需求,ChatGLM3提供1.5B、3B等更丰富的模型尺寸。支持国产芯片的Edge版模型ChatGLM3-1.5B,可在笔记本电脑、手机、汽车上部署。支持移动平台上CPU芯片推理,速度可达20 Tokens/s;精度方面,1.5B和3B模型在公开Benchmark上与ChatGLM-60接近。

在开源生态方面,智谱AI将对话ChatGLM3-6B、长文本ChatGLM3-6B-32k、多模态CogVLM-17B、智能体AgentLM开源。据悉,ChatGLM-6B在全球已有超1000万下载量,累计四周居于Hugging Face趋势榜第一,GitHub超5万Stars。

三、全新“智谱清言”上线,国内首推代码交互能力

在全新升级的ChatGLM3赋能下,生成式AI助手智谱清言已成为国内首个具备代码交互能力的大模型产品(Code Interpreter)。

体验地址:https://chatglm.cn/main/code

“代码”功能目前已支持图像处理、数学计算、数据分析等使用场景。以下分别为各个能力的演示情况截图:

处理数据生成图表:

代码绘制图形:

上传SQL代码分析:

随着WebGLM大模型能力的加入,智谱清言也具有了搜索增强能力,可以帮助用户整理出相关问题的网上文献或文章链接,并直接给出答案。

此前已发布的CogVLM 模型则提高了智谱清言的中文图文理解能力,取得了接近GPT-4V的图片理解能力,它可以回答各种类型的视觉问题,并且可以完成复杂的目标检测,并打上标签,完成自动数据标注。

四、推出智谱AI开放平台,API价格下降50%

面向企业级市场,智谱AI构建了智谱AI开放平台,包括私有模型方案、专属模型方案、开放模型方案。

随着本次发布,智谱AI的API产品矩阵发生变化:从提供ChatGLM-Pro、ChatGLM、ChatGLM-Lite多款产品,向提供一个整体ChatGLM-turbo演化,价格下降50%。

智谱AI开放平台不仅能够帮助提供API,也提供模型的定制化私有化以及自有数据的使用。平台还提供一些标准化的组件,比如外挂知识库、向量化能力等。

利用这些能力,用户能够快速的去构建自己的一些基本应用。

结语:全面对标OpenAI,智谱AI大模型再升级

2020年是大模型元年,GPT-3的出世标志着大模型进入“可用阶段”,也是生成式AI落地的第一阶段。这一阶段,产业关注的是怎么去构建一个精度足够高、稳定性足够好、更大规模的大模型。

智谱AI从2020年开始基于GLM预训练模型的框架做研发,到2021年发布第一个开源百亿大模型GLM-10B,到后续的一系列模型的诞生,不断迭代。对标OpenAI全模型产品线,是智谱AI在创立之初就一个写在愿景里的一个目标。

可以看到,对标OpenAI推出的ChatGPT、DALL.E、Codex、WebGPT和GPT-4V,智谱AI推出了ChatGLM对话、CogView文生图、CodeGeeX代码、WebGLM搜索增强和ChatGLM3图文理解等产品,体现了国产大模型的实力积淀。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
雷霆3-2领先马刺!这一战,不得不承认5个现实:亚历山大吃相难看

雷霆3-2领先马刺!这一战,不得不承认5个现实:亚历山大吃相难看

毒舌NBA
2026-05-27 11:43:05
6.4万 中国市场最贵辅助驾驶系统!特斯拉FSD已在国内灰度推送约5000台车

6.4万 中国市场最贵辅助驾驶系统!特斯拉FSD已在国内灰度推送约5000台车

快科技
2026-05-26 18:13:08
看李梅女儿和刘浩存飙戏,才知观众不是烦整容脸,而是丑还没演技

看李梅女儿和刘浩存飙戏,才知观众不是烦整容脸,而是丑还没演技

青橘罐头
2026-05-27 09:52:19
涉嫌严重违纪违法,崔汝山被查

涉嫌严重违纪违法,崔汝山被查

都市快报橙柿互动
2026-05-27 00:31:05
定都南方为什么会亡国

定都南方为什么会亡国

荆棘阿甘
2026-05-27 09:29:36
男乒夺冠的最大功臣既不是梁靖崑,也不是兜底的王楚钦,而是王皓

男乒夺冠的最大功臣既不是梁靖崑,也不是兜底的王楚钦,而是王皓

鸿印百合
2026-05-26 15:48:10
上海泳渡赛女选手隐私部位被直播!回应:正处于哺乳期 我公公都看到了

上海泳渡赛女选手隐私部位被直播!回应:正处于哺乳期 我公公都看到了

宝哥精彩赛事
2026-05-27 07:46:13
最高检挂牌督办,山西煤矿爆炸案死伤数字公布,害怕的不仅是企业

最高检挂牌督办,山西煤矿爆炸案死伤数字公布,害怕的不仅是企业

Mr王的饭后茶
2026-05-26 23:06:10
怀特塞德的名字已被CBA官网移除!无缘总决赛,兴奋剂实锤?

怀特塞德的名字已被CBA官网移除!无缘总决赛,兴奋剂实锤?

国篮会自强
2026-05-27 10:36:13
45辆新车在境外离奇消失!45笔零首付车贷,拖垮数十名普通人

45辆新车在境外离奇消失!45笔零首付车贷,拖垮数十名普通人

方圆
2026-05-25 14:50:41
亚历山大32+9狂创十纪录:历史第一+队史第一 怒吼庆祝夺赛点

亚历山大32+9狂创十纪录:历史第一+队史第一 怒吼庆祝夺赛点

醉卧浮生
2026-05-27 11:17:05
问政四川丨47万元电车行驶中动力中断,车主质疑存在重大安全隐患,4S店拒换车?记者调查

问政四川丨47万元电车行驶中动力中断,车主质疑存在重大安全隐患,4S店拒换车?记者调查

新浪财经
2026-05-26 18:56:13
神舟二十三号名单炸出照妖镜:黎家盈才刚上天,就刺痛了某些人?

神舟二十三号名单炸出照妖镜:黎家盈才刚上天,就刺痛了某些人?

叨唠
2026-05-26 16:53:22
法网再爆冷门,2-0,3-2,王欣瑜又赢了!又一大满贯冠军被一轮游

法网再爆冷门,2-0,3-2,王欣瑜又赢了!又一大满贯冠军被一轮游

八斗小先生
2026-05-27 11:34:27
且看马斯克的招聘广告,就是这么简单粗暴,请问你服不服…

且看马斯克的招聘广告,就是这么简单粗暴,请问你服不服…

慧翔百科
2026-05-27 08:48:46
意甲两位少帅崛起!一位受命于败军之际,一位创造队史百年纪录

意甲两位少帅崛起!一位受命于败军之际,一位创造队史百年纪录

体坛老球迷
2026-05-26 17:25:50
社保局内部人员坦言:办理退休签字一刻,务必亲口问清三句话

社保局内部人员坦言:办理退休签字一刻,务必亲口问清三句话

椰青美食分享
2026-05-25 19:15:50
河北消失的河流:滹沱河——扛着自行车就能过的大河,断流40年后

河北消失的河流:滹沱河——扛着自行车就能过的大河,断流40年后

坠入二次元的海洋
2026-05-27 01:02:34
82条人命换来的真相:山西矿难背后,一个你不敢直视的选择

82条人命换来的真相:山西矿难背后,一个你不敢直视的选择

菁菁子衿
2026-05-26 21:33:14
向华强揭向太老底,做手术前将隐藏资产全都告知老公,事后又要回

向华强揭向太老底,做手术前将隐藏资产全都告知老公,事后又要回

嫹笔牂牂
2026-05-27 07:45:08
2026-05-27 12:32:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11903文章数 117085关注度
往期回顾 全部

科技要闻

双双暴涨!SK海力士/美光市值均破万亿美元

头条要闻

男子投百万养鱼"打水漂":对方称每条鱼苗回收价3千元

头条要闻

男子投百万养鱼"打水漂":对方称每条鱼苗回收价3千元

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

小S晒归宁宴旧照,大S穿吊带裙扎丸子头

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

更智能的国民SUV 体验吉利博越L小蓝灯版

态度原创

旅游
艺术
本地
亲子
军事航空

旅游要闻

太美了!横沙岛这片“神仙花海”藏不住了

艺术要闻

这个夏天去苏州过几天清闲安逸的日子

本地新闻

用剪纸的方式,打开江苏扬州

亲子要闻

带孩子出发回中国,落地中国爷爷奶奶见到孙子孙女热泪盈眶!

军事要闻

特朗普称要和赖清德谈军售 国台办回应

无障碍浏览 进入关怀版