网易首页 > 网易科技 > 网易科技 > 正文

元象开源650亿参数高性能大模型,无条件免费商用

0
分享至

11月6日消息,元象XVERSE公司宣布,开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。

元象XVERSE创始人姚星表示:“面对研发时间紧、算力持续短缺等挑战,团队依靠丰富经验,三个月内研发出多款高性能7B、13B模型,并最早为社区献上一个‘大有可为’的65B模型,为研究、商业及生态创造三重价值。”


据介绍,XVERSE-65B底座模型在2.6万亿Tokens的高质量数据上从头训练,上下文窗口扩展至16K,支持中、英、俄、法等40多种语言。

元象坚持“高性能”定位,提升了65B三方面能力: 一、理解、生成、推理和记忆等基础能力,到模型的多样性、创造性和精度表现,从优异到强大;二、扩展了工具调用、代码解释、反思修正等能力,为构建智能体(AI Agent)奠定技术基础,提高模型实用性;三、显著缓解7B、13B中常见且可能很严重的幻觉问题,减少大模型“胡说八道”,提高准确性和专业度。

据悉,元象大模型系列均为全链条自研,涵盖多项关键技术与研发创新:

复杂分布式系统设计:借鉴团队研发腾讯围棋AI“绝艺”、王者荣耀AI“绝悟”等大系统上的丰富经验,自研高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台与框架协同等关键技术,打造高效稳定的训练系统, 千卡集群峰值算力利用率达58.5%。

全面提升性能:65B训练中采用FlashAttention2加速计算, 3D并行基础上采用虚拟流水线(virtual pipeline)技术,降低较长流水线产生过高气泡率,提升计算推理效率; 上下文窗口长度从8K逐步提升到16K,使其不仅能出色完成复杂任务,包括长文理解、长文生成和超长对话,还拓展了工具调用、代码解释及反思修正能力,能更好构建智能体(AI Agent)。

提升训练稳定性:因计算量庞大,通信拥塞、芯片过热或计算节点故障成为65B训练常态,初期出现过一周最高八次故障的情况。通过集群基础设施运营、资源调度、训练框架和调度平台协同等持续优化,元象打造出高稳定、低中断、强容错的训练系统,将每周有效训练率提升至98.6%。

此外,在接近1.6万亿Tokens的模型训练中期,损失函数产生了NaN值,可能导致训练中断。通常情况下,业界一般会在分析后删除与之相关的数据区间。而团队根据经验判定这是模型自然演化,选择不删除数据,直接跳过相关参数更新,最终 NaN值 问题解决。后期对参数值、激活值、梯度值等中间状态的进一步分析表明,该问题可能 与模型最后一层transformer block激活值的最大值变化有关,并会随最大值的逐渐降低而自行解决。

为确保业界能对元象大模型性能有全面、客观、长期认知,研究人员参考了一系列权威学术测评,制定了涵盖问答、理解、知识、推理、数学、代码等六个维度的11项主流权威测评标准,将持续使用并迭代。

XVERSE-65B在与国外标杆对比测评中,部分指标超越、综合性能媲美GPT3.5;全面超越开源标杆 Llama2-70B和Falcon-180B ;与GPT4仍有差距。

据介绍,元象大模型可在Github、Hugging Face、魔搭ModelScope等多平台搜索“XVERSE”下载,简单登记后即可无条件免费商用,能满足中小企业、科研机构和个人开发者绝大部分的应用与迭代需求。

元象同时提供模型训练、推理、部署、精调等全方位技术服务,赋能文娱、金融、医疗等各行各业,帮助在智能客服、创意写作、精准推荐等多场景打造行业领先的用户体验。2023年10月, 腾讯音乐宣布与元象大模型建立战略合作 ,共同推出lyraXVERSE加速大模型、全面升级其音乐助手“AI小琴”,未来还将持续探索AI与3D前沿技术。(一橙)

延伸阅读
相关推荐
热点推荐
浓眉玻璃心!独行侠133:140不敌爵士结束两连胜

浓眉玻璃心!独行侠133:140不敌爵士结束两连胜

大眼瞄世界
2025-12-16 23:43:49
上海男篮输球揪出最大毒瘤!他上场12分钟 投篮4中0 上空篮都不进

上海男篮输球揪出最大毒瘤!他上场12分钟 投篮4中0 上空篮都不进

篮球专区
2025-12-16 22:52:28
场均24.4分!卡梅隆托马斯,为何没人要了?

场均24.4分!卡梅隆托马斯,为何没人要了?

篮球实录
2025-12-17 13:26:59
王励勤大动作,26年WTT首站国乒名单出炉,球迷:头撞墙知道拐了

王励勤大动作,26年WTT首站国乒名单出炉,球迷:头撞墙知道拐了

阿纂看事
2025-12-16 10:03:12
美国3次出手不管用,黎智英终极审判来了!反恐特勤现场持枪戒备

美国3次出手不管用,黎智英终极审判来了!反恐特勤现场持枪戒备

墨印斋
2025-12-17 00:13:08
汕头一大酒店涉黄被查!

汕头一大酒店涉黄被查!

澄海圈
2025-12-15 21:11:09
定了!天津一片区启动大规模拆迁!

定了!天津一片区启动大规模拆迁!

天津人
2025-12-17 11:25:02
金正恩带妻子女儿一起亮相了!12岁千金穿黑色大衣美翻,不输妈妈

金正恩带妻子女儿一起亮相了!12岁千金穿黑色大衣美翻,不输妈妈

时尚丽人风行
2025-12-17 09:56:25
火箭申请1250万伤病特例:队内7人解开交易限制 斯通着手阵容补强

火箭申请1250万伤病特例:队内7人解开交易限制 斯通着手阵容补强

颜小白的篮球梦
2025-12-17 11:38:07
反转!曝许亚军10年来出钱出力帮何晴,和小儿子去美国是拍戏!

反转!曝许亚军10年来出钱出力帮何晴,和小儿子去美国是拍戏!

古希腊掌管月桂的神
2025-12-17 10:05:58
警方凌晨通报:张某军(男,43岁)投案

警方凌晨通报:张某军(男,43岁)投案

南方都市报
2025-12-17 09:25:24
警察与公务员职级对照一览表(建议收藏)

警察与公务员职级对照一览表(建议收藏)

微法官
2025-12-16 21:09:19
有情有义!保利尼奥拒绝巴西国家队邀约:正考虑重回中超!

有情有义!保利尼奥拒绝巴西国家队邀约:正考虑重回中超!

邱泽云
2025-12-16 23:17:24
29分惨败!杨瀚森14+6,赛后小杨走过去,和国王球员逐一击掌

29分惨败!杨瀚森14+6,赛后小杨走过去,和国王球员逐一击掌

担酒
2025-12-17 12:13:43
笑了!柬泰冲突后,泰国驻华大使馆微博下面,全是一样的评论

笑了!柬泰冲突后,泰国驻华大使馆微博下面,全是一样的评论

消失的电波
2025-12-15 14:10:23
61岁何晴最后时光:生活拮据将房子过户给儿子,遗憾一件事未办成

61岁何晴最后时光:生活拮据将房子过户给儿子,遗憾一件事未办成

李健政观察
2025-12-17 09:45:11
安宫牛黄丸为何成了中国最昂贵的假药?

安宫牛黄丸为何成了中国最昂贵的假药?

微评社
2025-12-15 15:38:28
伤亡700人,中方援建大桥被炸,中械军大胜,大批导弹成战利品

伤亡700人,中方援建大桥被炸,中械军大胜,大批导弹成战利品

爱情毕业了
2025-12-17 08:28:28
NBA杯落幕!诞生了4个赢家,以及5个输家!尼克斯、马刺位列其中

NBA杯落幕!诞生了4个赢家,以及5个输家!尼克斯、马刺位列其中

小火箭爱体育
2025-12-17 12:23:32
2025最惨大撤退:18万家快递驿站,快把所有人得罪光了

2025最惨大撤退:18万家快递驿站,快把所有人得罪光了

金错刀
2025-12-14 15:34:35
2025-12-17 13:52:49

科技要闻

无人驾驶迈关键一步 特斯拉股价触历史新高

头条要闻

独居女子去世遗产被收归国有 远亲想帮买墓安葬遇难题

头条要闻

独居女子去世遗产被收归国有 远亲想帮买墓安葬遇难题

体育要闻

短短一年,从争冠到0胜垫底...

娱乐要闻

鞠婧祎收入曝光,丝芭称已支付1.3亿

财经要闻

"祥源系"爆雷 有投资者数百万元无法提现

汽车要闻

一车多动力+双姿态 长城欧拉5上市 限时9.18万元起

态度原创

教育
时尚
游戏
本地
健康

教育要闻

重磅!深圳这所公办新校与北京十一学校合作办学!

那些被称赞 “老得慢” 的阿姨们,这样穿,比同龄人显年轻

拉瑞安确认《神界》新作将使用AI工具参与开发 不会涉及创意内容

本地新闻

云游安徽|踏过战壕与石板,读一部活的淮北史

这些新疗法,让化疗不再那么痛苦

无障碍浏览 进入关怀版
×