网易首页 > 网易号 > 正文 申请入驻

中国首个音乐SOTA模型「天工音乐大模型」今日公测

0
分享至

2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!


一年前的今天,第一版天工大模型正式对外发布上线,一年来我们不断迭代模型,迭代应用产品,模型和应用都越做越好,以此回报广大用户的支持。


「天工3.0」拥有4000亿参数,超越了3140亿参数的Grok-1,是全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。


(天工3.0模型参数超越Grok-1,成全球最大开源MoE专家混合大模型)

强大的模型技术实力赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。


(天工3.0多模态性能超越GPT-4V,全球领先)

同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开放公测。「天工SkyMusic」是中国首个音乐SOTA模型,更是中国的自研大模型技术第一次在AIGC领域领跑全球。


(天工SkyMusic综合性能超越Suno V3,取得音乐大模型SOTA,领跑全球)

天工SkyMusic:中国首个音乐AIGC SOTA模型

此前,大模型已经在文本、图像等多个技术领域取得突破,带来产业全面变革。然而,在AI音乐生成领域,全球迟迟等不到一款产品,开启「音乐ChatGPT时刻」。

这是因为一直以来,AI音乐行业大量研究都集中在符号音乐生成技术路线上,并且大多只能实现无人声背景音乐(Background Music,BGM)的生成,音乐的质量、效果、审美都远远达不到可用水平,产业迟迟未能爆发。


(「天工SkyMusic」自研AI音乐大模型技术架构)

与行业主流路径不同,「天工SkyMusic」采用自研大模型音乐音频生成技术路线。这一路线直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成,技术难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与。

在与海外顶尖的AI音乐大模型Suno V3的横向测评中,「天工SkyMusic」在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。

此外,「天工SkyMusic」还拥有独创的参考音乐生成与方言歌曲生成能力。

参考音乐生成:用户可上传自有参考音乐,或选择「天工SkyMusic」资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。

方言歌曲生成:「天工SkyMusic」生成的音乐不仅在人声自然度、发声可懂度等领域表现优秀,更能够支持粤语、成都话、北京话等众多方言,让用户能够更自由地实现音乐表达,传播方言文化。

「天工SkyMusic」是中国首个公开可用的AI音乐生成模型,更是中国自研大模型技术第一次在AIGC领域领跑全球。

当前,在文本大模型领域,OpenAI吸引了全球的注意力;但是在AI搜索、AI音乐生成等细分领域,中国玩家们正在奋勇前行,不断通过自研技术取得细分领域顶尖的SOTA表现,共同建设中国大模型产业,打造自主可控的大模型产业生态。

天工3.0:4000亿参数,全球最大开源MoE大模型

在上一代「天工2.0」MoE大模型的领先基础上,「天工3.0」实现了全面的性能升级,采用了4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、性能最强的开源MoE模型。

「天工3.0」的逻辑推理能力、语义理解能力、应对复杂需求能力、内容创作能力全面升级,并新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项AI能力,为用户带来全新AI体验。

多轮搜索与综合工具调用:「天工3.0」针对模型独立规划、调用、组合外部工具及整合信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求。

同时,「天工3.0」能够通过强大的语义理解能力将用户任务拆解成细分环节,实时判断是否需要联网或调用工具,进行单轮或多轮的联网搜索、工具调用,完成包括多轮搜索、热点信息分析、图片生成等复杂用户需求。




(Query:查询最新中国历史电影票房排行,图表展示)

图表绘制:「天工3.0」全面提高了逻辑推理能力与用户自然语言Query的理解能力,使其能够更精准地判断用户需求,独立生成并调用代码,结合文本需求实时进行内容分析及图表构建,为用户带来更直观、高效的对比结果。



(Query:北京、上海、重庆哪个好玩?)

多轮搜索、综合工具调用、图表绘制等都是「天工3.0」所独有的大模型综合能力,其从底层打通了「天工3.0」的AI搜索、AI对话、AI代码生成、AI图片识别、AI图像生成等底层能力,通过语义识别能力直接触发,为用户带来更加便捷、高效的AI体验,成为真正的AI生产力工具。

此外,「天工3.0」中还增加了研究模式、增强模式、改图扩图等多项AI能力。

研究模式:在研究模式中,「天工3.0」能够围绕用户的某个简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图,帮助用户快速清晰地把握核心内容,完成用户复杂的研究需求。





(Query:康乾盛世年代)

增强模式:在增强模式中,「天工3.0」能够针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不确定性知识时表现更好,能够更精准、高效地满足用户需求。




(Query:2024年春节档电影;「天工3.0」理解并追问用户需求)

改图扩图:「天工3.0」多模态性能取得全面突破,超越GPT-4V,综合排名全球第一。在强大的技术底座支持下,「天工3.0」的AI绘图能力新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功能。




(「天工3.0」的AI改图、修图、扩图等功能)

关于昆仑万维

自去年4月17日「天工」大模型正式推出以来,昆仑万维已围绕「天工」系列大模型建起AI大模型、AI搜索、AI音乐、AI视频、AI社交、AI游戏等AI业务矩阵,是国内模型技术与工程能力最强、布局最全面的人工智能科技企业之一。

这一年里,除了对「天工」系列基座大模型进行不断升级迭代,昆仑万维还推出了国内第一款AI搜索引擎「天工AI搜索」、开源了百亿级大语言模型「天工Skywork-13B」、推出国内领先的AI Agent开发平台「天工SkyAgents」等一系列前沿大模型产品。

当前,「天工」系列大模型已集成了AI音乐、AI搜索、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项能力,并将在未来加入AI视频功能,对标“超级应用”,成为人工智能时代的“超级大模型”(Super Model)。在“实现通用人工智能,让每个人更好地塑造和表达自我”的公司使命驱动下,昆仑万维将始终致力于AI技术与产品的创新开拓,不断提高AI产品的用户体验,与用户、研究人员、开发者们携手,共创国产大模型的未来。

雷峰网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最强女海王!河南已婚女子同时交13名男友,颜值照曝光,网友:确实长得美……

最强女海王!河南已婚女子同时交13名男友,颜值照曝光,网友:确实长得美……

鱼乐星鲜事
2024-04-08 20:38:06
曼联或将在2024年夏天永久出售马库斯·拉什福德

曼联或将在2024年夏天永久出售马库斯·拉什福德

星耀国际足坛
2024-04-30 12:01:41
CBA豪门出局,布莱德索面临退役,刘鹏:王哲林被浙江男篮针对了

CBA豪门出局,布莱德索面临退役,刘鹏:王哲林被浙江男篮针对了

菲菲爱篮球
2024-04-30 12:31:22
河北人肉煎饼案谷宝成被执行死刑,行刑前哭着抽完2根烟

河北人肉煎饼案谷宝成被执行死刑,行刑前哭着抽完2根烟

青丝人生
2024-04-07 19:08:37
烤肉姐:联盟正更新换代 还剩下快船和独行侠拉力 快船挺住

烤肉姐:联盟正更新换代 还剩下快船和独行侠拉力 快船挺住

直播吧
2024-04-30 12:50:24
特斯拉向部分中国车主发出FSD Beta体验邀请 稳了?

特斯拉向部分中国车主发出FSD Beta体验邀请 稳了?

手机中国
2024-04-29 19:18:21
重磅!内地人来港不限次数,停留时间也延长!

重磅!内地人来港不限次数,停留时间也延长!

港漂圈
2024-04-29 19:50:53
国家统计局:4月份,制造业采购经理指数、非制造业商务活动指数和综合PMI产出指数分别为50.4%、51.2%和51.7%

国家统计局:4月份,制造业采购经理指数、非制造业商务活动指数和综合PMI产出指数分别为50.4%、51.2%和51.7%

每日经济新闻
2024-04-30 09:36:21
伦纳德:都怪我盲目复出害了快船,哈登为了我牺牲了太多的数据

伦纳德:都怪我盲目复出害了快船,哈登为了我牺牲了太多的数据

记树与海
2024-04-29 10:36:54
普京的秘密情人卡巴耶娃:未婚却连生4子,二人绯闻是真的吗?

普京的秘密情人卡巴耶娃:未婚却连生4子,二人绯闻是真的吗?

悦悦侃历史
2024-04-29 13:16:44
如果你了解阿劳霍的年薪,就应该清楚,他为何有这样的表现

如果你了解阿劳霍的年薪,就应该清楚,他为何有这样的表现

老乐说球
2024-04-30 09:38:51
威廉王子与凯特王妃迎来13周年婚礼庆祝,王妃发布从未曝光的照片

威廉王子与凯特王妃迎来13周年婚礼庆祝,王妃发布从未曝光的照片

土澳的故事
2024-04-29 21:23:35
又一车企党委书记被查!

又一车企党委书记被查!

电动知家
2024-04-29 17:15:38
国家发改委:希望央企“一企一策”制定设备更新工作方案 优先选择一批能耗高、排放大、效率低的设备尽快更新改造

国家发改委:希望央企“一企一策”制定设备更新工作方案 优先选择一批能耗高、排放大、效率低的设备尽快更新改造

财联社
2024-04-30 11:10:14
连炮衣都掀了,日本当时可能真敢开火!

连炮衣都掀了,日本当时可能真敢开火!

杂谈天下式
2024-04-30 00:25:49
不顾美国反对,以色列和中国签140亿合作,中以合作又有新消息

不顾美国反对,以色列和中国签140亿合作,中以合作又有新消息

趣珈小史
2024-04-30 07:20:11
独行侠队成为输家,哈登、乔治、东契奇和欧文上场时间超四十分钟

独行侠队成为输家,哈登、乔治、东契奇和欧文上场时间超四十分钟

体坛24小时
2024-04-29 18:12:34
网红关掉滤镜那一刻,世界安静了,榜一大哥连夜跑了

网红关掉滤镜那一刻,世界安静了,榜一大哥连夜跑了

博学老K杂谈
2024-04-12 18:25:03
英国网红:NB已经被写进英文牛津词典,niubi这下全世界在知道了

英国网红:NB已经被写进英文牛津词典,niubi这下全世界在知道了

七阿姨爱八卦
2024-04-27 15:18:29
虽然苗苗这几年很频繁地生育,但真的没咋变老 这在于她有钞能力

虽然苗苗这几年很频繁地生育,但真的没咋变老 这在于她有钞能力

全球历史观
2024-04-29 15:15:35
2024-04-30 13:18:44
雷峰网
雷峰网
关注智能与未来!
63982文章数 655097关注度
往期回顾 全部

科技要闻

特斯拉和百度独家深度定制车道级高辅地图

头条要闻

内蒙古开鲁县回应承包人身份传言:确实曾任县政协常委

头条要闻

内蒙古开鲁县回应承包人身份传言:确实曾任县政协常委

体育要闻

上海男篮:年轻人,学费总是要交的

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

查道炯:中国经济的外部挑战与应对思考

汽车要闻

越野老炮最爱 哈弗新H9新增2.4T柴油机

态度原创

手机
亲子
旅游
数码
军事航空

手机要闻

一加Nord 4 Geekbench跑分曝光 单核1875 多核4934

亲子要闻

连尿都控制不好的年纪却控制住了情绪

旅游要闻

五一大雨,浇灭了多少旅游城市的心气?

数码要闻

联想Tab K11 Plus即将发布!预计搭载高通骁龙680

军事要闻

以官员:以总理求助拜登阻止逮捕令

无障碍浏览 进入关怀版