网易首页 > 网易财经 > 正文

Moonshot AI大模型服务Kimi Chat开始内测,火山引擎提供训练推理加速解决方案

0
分享至

(原标题:Moonshot AI大模型服务Kimi Chat开始内测,火山引擎提供训练推理加速解决方案)

10月9日,北京月之暗面科技有限公司(Moonshot AI)宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品Kimi Chat这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着Moonshot AI在这一重要技术上取得了世界领先水平。

火山引擎Moonshot AI深度合作,为其独家提供高稳定性和高性价比的AI训练和推理加速解决方案,双方联合进行技术研发,共同推进大型语言模型在垂直领域和通用场景的应用落地。同时,Kimi Chat即将入驻火山引擎大模型服务平台——火山方舟,双方将持续在大模型生态领域为企业和消费者提供更丰富的AI应用。

相比当前市面上以英文为基础训练的大模型服务,Kimi Chat具备较强的多语言能力,例如,Kimi Chat在中文上具备显著优势,实际使用效果能够支持约20万汉字的上下文,2.5倍于Anthropic公司的Claude-100k(实测约8万字),8倍于OpenAI公司的GPT-4-32k(实测约2.5万字)。同时,Kimi Chat能够通过创新的网络结构和工程优化,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。

Moonshot AI创始人杨植麟此前在接受采访时曾表示,无论是文字、语音还是视频,对海量数据的无损压缩可以实现高程度的智能。大模型的能力上限(即无损压缩比)是由单步能力和执行的步骤数共同决定的,前者与参数量相关,后者即上下文长度。

应对大语言模型落地挑战,推动行业应用落地

Moonshot AI相信,更长的上下文长度可以为大模型应用带来全新的篇章,促使大模型从 LLM时代进入Long LLM (LLLM)时代,与千行百业精准适配。大模型应用在寻找有效处理长文本场景的方法时,需要持续探索解决降低模型幻觉和提高生成内容可控性的新手段,寻求大模型能力个性化的新路线。在大型语言模型研发过程中,还需要跨越算力资源需求膨胀、任务工程稳定性差、项目成本高昂、安全与信任等诸多门槛,以提升模型的训练效率。

为了解决上述问题,Moonshot AI携手火山引擎进行AI技术创新,在火山引擎机器学习平台veMLP上进行AGI实践。Moonshot AI充分利用GPU资源池,基于大规模预训练模型,实现每天数千卡规模的常态稳定训练,六个月内训练出千亿参数规模语言大模型Kimi Chat,解锁专业场景写作、超长文本理解分析、超长记忆的个性化对话、基于大量文档的知识问答等复杂场景,并成功在多家知名企业中应用。

Moonshot AI联合创始人周昕宇表示:“Moonshot AI聚焦于探索通用人工智能的边界,致力于寻求将算力转化为智能的最优解。火山引擎拥有国内领先的基础设施能力和算力储备,未来双方将进一步在AI算力基础设施和应用场景拓展等方面展开合作,共同推动人工智能技术的发展,为用户带来稳定、高效、智能的服务体验。”

基于火山引擎机器学习平台,大模型训练更稳、更快

火山引擎为大模型的构建和训练提供高稳定性和高性价比的AI训练和推理加速解决方案,其机器学习平台veMLP经过抖音等海量用户业务长期打磨,沉淀形成了全栈AI开发工程优化方案、任务故障自愈、实验可观测性等解决方案和最佳实践,提供高效、稳定、安全互信的一站式AI算法开发和迭代服务,让大模型训练更快、更稳、更高性价比。Moonshot AI基于火山引擎提供的超大规模AI训练和推理加速解决方案,帮助团队快速、稳定、低成本地实现大型语言模型的持续训练迭代、精调和推理。

1.IaaS算力和存储资源的规模化调度

搭建高性能计算集群,实现万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本;利用vePFS+TOS冷热分层加速方案,满足训练数据高吞吐的同时整体存储成本降低65%。针对大模型的文件系统读写 Pattern,共同研发专用文件缓存系统,大幅提升显卡利用率。

2.PaaS计算集群稳定性保障

优化超大训练集群的稳定性,提供硬件故障自愈优化和自主诊断能力,允许用户任务迅速重试续训,实现月级别的稳定训练,通过多机训练任务通信亲和性优化,减少RingAllReduce的跨交换机通信。

3.实验高可观测性

对多个训练任务做实验管理,通过可视化方式对比训练结果,以确定迭代上线的模型;利用完备监控日志,助力业务调优3D 并行参数,辅助定位训练故障。

4.大模型服务安全互信方案

将可信隐私计算与LLM应用相结合,提供安全沙箱功能,完善开发人员权限管控。火山引擎还与Moonshot AI一起设计适合大模型研发习惯的工作流,确保工作效率前提下,实现数据的分级访问,保证数据安全。

火山引擎智能算法负责人吴迪表示:“火山引擎一直秉持着聚焦技术、赋能伙伴、价值共生的合作态度,Moonshot AI拥有国内先进的大模型研发团队,对AI技术有着深入的理解和应用经验,双方的合作将进一步在多模型生态服务领域为企业和消费者提供更丰富的AI应用。”

 

 

火山方舟功能全景图

目前,火山引擎大模型服务平台——火山方舟上已入驻智谱AI、 Minimax、字节跳动云雀等多家AI科技公司及科研院所的大模型,Moonshot AI的大模型服务Kimi Chat也将登陆火山方舟。火山引擎将持续联合国内优秀的大模型服务商,提供模型训练、推理、评测、精调等全方位功能与服务,助力千行百业加速AI进程。欢迎各位企业在方舟中体验大模型, 火山方舟愿与大家的业务共同成长!



相关推荐
热点推荐
张康阳办公室被清空,国米球迷组织:感谢!希望尽快回来

张康阳办公室被清空,国米球迷组织:感谢!希望尽快回来

叶青足球世界
2024-05-22 20:23:26
商务部的信心:有能力达到CPTPP的高标准

商务部的信心:有能力达到CPTPP的高标准

永不出场的戈多
2024-05-23 10:41:23
美国国籍刘亦菲,为何被中国外交部称是真正中华儿女,她做了什么

美国国籍刘亦菲,为何被中国外交部称是真正中华儿女,她做了什么

纵横文史记
2024-05-23 00:05:28
70岁奶奶满头白发偏要尝试公主裙,售货员说不适合她,她还是要买

70岁奶奶满头白发偏要尝试公主裙,售货员说不适合她,她还是要买

大脸猫做局
2024-05-22 21:27:36
送给中国式家长的一记响亮耳光:教育投资是最血本无归的项目!

送给中国式家长的一记响亮耳光:教育投资是最血本无归的项目!

芯怡飞
2024-05-18 12:12:01
恰尔汗奥卢告别张康阳:告别从来不易,这次尤其艰难

恰尔汗奥卢告别张康阳:告别从来不易,这次尤其艰难

懂球帝
2024-05-23 04:29:07
报复筹码?汪小菲儿子被退学,网友:难怪大s好心让汪小菲去接娃

报复筹码?汪小菲儿子被退学,网友:难怪大s好心让汪小菲去接娃

阿桥侃娱乐
2024-05-23 08:15:06
德克兰·赖斯给英格兰队带来了难题

德克兰·赖斯给英格兰队带来了难题

星耀国际足坛
2024-05-23 10:01:49
医院的瓜 永远最顶。

医院的瓜 永远最顶。

元爸体育
2024-05-21 00:35:03
台湾以人口2300万,创造出5万亿GDP,放在全中国是什么水平?

台湾以人口2300万,创造出5万亿GDP,放在全中国是什么水平?

探秘历史
2024-04-27 13:20:03
一部代表作都没有,却能高高在上当评委,小丑的闹剧何时才能结束

一部代表作都没有,却能高高在上当评委,小丑的闹剧何时才能结束

四川囧囧呀
2024-05-22 23:59:53
出人意料,英国要提前大选

出人意料,英国要提前大选

寰宇大观察
2024-05-23 10:32:45
辽宁三连冠!500万大咖怒喷:这是中国篮球的耻辱和悲哀

辽宁三连冠!500万大咖怒喷:这是中国篮球的耻辱和悲哀

弄月公子
2024-05-23 08:38:09
衣锦还乡!辽宁男篮今早已经启程返回沈阳

衣锦还乡!辽宁男篮今早已经启程返回沈阳

直播吧
2024-05-23 09:42:25
惊险!普京专机抵华之际,美空军F22起飞!韩媒:F22在韩国军演

惊险!普京专机抵华之际,美空军F22起飞!韩媒:F22在韩国军演

点兵
2024-05-21 22:44:53
放弃2.7亿要1.5亿?布伦森太明智,尼克斯有意让维拉诺瓦四星齐聚

放弃2.7亿要1.5亿?布伦森太明智,尼克斯有意让维拉诺瓦四星齐聚

你的篮球频道
2024-05-23 09:27:23
三大“炫富”网红齐被封!郭有才正式入驻ks平台!二驴月抽成骡子20多万。

三大“炫富”网红齐被封!郭有才正式入驻ks平台!二驴月抽成骡子20多万。

圈里的甜橙子
2024-05-23 00:11:19
这一字体,专家瞧不上,大众却深爱不已,是时候为它说句公道话了

这一字体,专家瞧不上,大众却深爱不已,是时候为它说句公道话了

书法网
2024-05-20 19:05:15
冈田武史“抱怨”:为什么我带浙江的时候,没有这样的待遇?

冈田武史“抱怨”:为什么我带浙江的时候,没有这样的待遇?

懂球帝
2024-05-23 09:07:10
前总监:拜仁结构混乱始于8000万签卢卡斯,现队中太多高薪平庸者

前总监:拜仁结构混乱始于8000万签卢卡斯,现队中太多高薪平庸者

直播吧
2024-05-23 08:13:09
2024-05-23 12:08:49

财经要闻

英伟达Q1收入猛增三倍、利润翻五倍!

头条要闻

繁体字配文 东部战区发布六大"越海杀器"

头条要闻

繁体字配文 东部战区发布六大"越海杀器"

体育要闻

张氏父子的一场大梦

娱乐要闻

大S儿子被学校退学,张兰称孙子没人管

科技要闻

英伟达狂飙 黄仁勋说要开启"新的工业革命"

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

旅游
家居
时尚
教育
军事航空

旅游要闻

日本航空飞机在羽田机场地面与其他飞机发生接触

家居要闻

化实为虚 理性与柔美的交互

适合夏季借鉴的通勤装扮,简约不失高级风采,学会了优雅又显瘦

教育要闻

康辉采访秀英文,翻译自愧不如:我先下班!论央视名嘴康辉多优秀

军事要闻

以军继续杰宁攻势 巴武装组织打击以目标

无障碍浏览 进入关怀版
×