
![]()
近期,昆仑天工重磅发布音乐大模型Mureka V8,这场AI沉浸式音乐会,在行业内掀起轩然大波,更在海外多个国家和地区引发震撼效应。这场无需人类音乐人参与、从旋律创作、编曲配器,到人声合成、音质优化的全流程AI音乐会,以灵动婉转的旋律、饱满细腻的音色,以及精准传递情绪的表达力,彻底打破了外界对AI音乐“生硬、模板化”的固有认知,让行业看到了AI音乐从“可用”向“好用、可商用”跨越的全新可能。
![]()
作为昆仑天工全模态布局在音乐领域的重磅升级之作,Mureka V8的突破绝非偶然,而是依托昆仑天工MusiCoT技术体系的持续迭代与深耕。Mureka V8不仅成功填补了AI音乐专业级创作的市场空白,更以低成本、高效率的创作优势,彻底打破了传统音乐产业“创作门槛高、制作成本高、变现周期长”的三大困境。
Mureka V8的成功发布,背后是昆仑天工在全模态赛道的长期深耕,更是其坚定奔赴AGI终极目标的一个缩影。如今,AI行业已经彻底告别“野蛮生长”的初期阶段,完成了“能用”的核心验证,行业叙事开始出现清晰的两极分化:一边是乐观派仍在高声预言AGI(通用人工智能)的到来,坚信随着技术的持续迭代,算力、数据、算法的瓶颈终将被打破,机器终将拥有与人类同等的通用智能,能够适配所有复杂场景、完成所有人类可完成的智力任务;另一边则是愈发明显的犹疑之声,部分从业者在经历了多轮技术迭代的瓶颈后,开始感叹“AGI已死”,认为AGI只是一个遥不可及的幻想,呼吁行业放下对远期愿景的执念,将全部焦点回归当下,深耕单一场景的技术落地与商业价值变现,不要在“虚无缥缈”的AGI愿景上浪费资源。
所谓“黄昏见证真正的信徒”,AGI如今依旧是整个AI行业仰望的终极目标,却已不再是唯一的叙事中心。在这场关于AGI的“生死思辨”中,大多数企业选择了随波逐流,要么放弃AGI愿景,深耕单一模态或浅层场景;要么陷入“纯技术研发”的困境,无法实现商业落地,最终在算力、数据的瓶颈下逐渐掉队。而昆仑天工,作为昆仑万维旗下的核心AI品牌,始终以实现AGI为核心愿景,没有随波逐流选择退缩,而是坚定扛起AGI的旗帜,在质疑声中稳步前行。尤为关键的是,它没有盲目跟风,而是精准判断行业趋势,选择了一条被全球业内专家公认的AGI终极形态之路——全模态输入与全模态输出,成为国内少数真正落地践行这一路线、持续推进AGI落地的核心玩家,也成为AI行业“务实主义”的标杆。
![]()
要理解昆仑天工选择全模态路径的正确性,首先需要看清当前AGI赛道的核心困境与路径分野。近年来,行业对AGI的质疑声从未停歇,这种质疑的核心,并非源于对技术迭代的不信任,而是源于对物理世界客观限制的悲观主义认知——算力瓶颈难以快速突破、高质量数据稀缺且获取成本高企、算法迭代陷入平台期,三大核心要素的限制同时收紧,让通向AGI的道路布满荆棘,边际成本也随之攀升至多数企业难以承受的高度。
从算力来看,当前大模型的研发与训练,需要海量的算力支撑,而高端GPU芯片的稀缺、算力成本的居高不下,成为制约AGI发展的首要瓶颈。高昂的算力成本对于大多数中小企业而言,几乎是无法承担的投入;从数据来看,AGI的发展需要海量高质量、多维度、多场景的训练数据,而当前行业内的高质量数据大多被巨头垄断,中小玩家难以获取,且数据标注、清洗的成本极高,低质量数据不仅无法推动模型迭代,反而会拖累模型性能;从算法来看,当前大模型的算法迭代陷入平台期,虽然在具体场景的精度上有所提升,但在“通用智能”的核心突破上,始终没有实质性进展,算法的局限性,让很多企业开始怀疑“AGI是否真的能够实现”。
面对这样的潜在桎梏,不同的企业选择了不同的技术路径,也构成了当下AGI赛道的核心分野。从行业现状来看,通向AGI的路径主要分为三类,三类路径各有优劣,也对应着不同企业的战略选择:
第一类,聚焦单一模态极致突破,深耕文本、图像、音频等单一领域,试图通过单点领先,逐步延伸至全场景。
这类路径的核心优势是落地快、成本低,能够快速在单一场景实现技术落地与商业变现,比如专注于文本生成的大模型、专注于图像生成的AI工具等,都是这类路径的代表。但这类路径的局限性也极为明显——单一模态的能力无法实现真正的通用智能,人类对世界的感知与表达是多维度的,仅靠单一模态的突破,无法让机器真正理解人类的需求、适配复杂的真实场景,最终只能停留在“专用智能”的层面,难以向AGI迈进。
第二类,走“多模态拼接”路线,将不同模态的技术模块简单组合,看似具备了多模态输入与输出的能力,能够处理文本、图像、音频等多种数据。
这类路径的核心优势是能够快速搭建起“多模态”的框架,吸引市场关注,短期内能够获得一定的流量与融资。但这类路径的本质的是“伪多模态”,缺乏底层统一的模型架构,不同模态的技术模块之间相互独立,无法实现跨模态的协同智能,比如文本生成的内容无法与图像、音频精准匹配,图像识别的结果无法转化为有逻辑的文本表达,最终只能沦为“噱头”,无法实现真正的商业价值,更无法通向AGI。
第三类,深耕全模态输入与全模态输出,打造底层统一的模型架构,实现文本、图像、音频、视频、3D等多模态数据的原生理解与生成,真正模拟人类的感知与表达能力。
这类路径的核心优势是贴合AGI的终极形态,能够实现跨模态的协同智能,让机器像人类一样,同时处理多维度的信息,精准理解人类的需求,适配复杂的真实场景。但这类路径的门槛极高,不仅需要企业具备强大的底层模型研发能力,能够打造统一的全模态架构,还需要海量高质量的多模态数据作为支撑,更需要贯通上下游的场景资源,实现“技术-商业”的闭环,才能持续推进研发与落地,这也是为什么绝大多数企业不敢选择这条路径的核心原因。
对大多数只做模型研发、缺乏稳定业务反哺、无法实现“技术-商业”闭环的企业而言,退一步选择前两类路径,无疑是更理性的选择:既能降低研发风险,也能快速实现商业回报,避免陷入“投入巨大、毫无产出”的困境。这像极了一场高风险的德州扑克,看牌往往需要付出高昂的代价,有时甚至会耗尽前期所有积累。面对这样的代价,弃牌固然是稳妥、理性的选择,能及时止损、保住现有筹码,却永远看不到下一张牌的模样——而那一张未被看到的牌,或许就是打破格局、奠定胜负、实现AGI突破的关键一手。
这场行业分野的内核,从来都不是“谁更相信AGI”,而是“谁付得起相信AGI的成本,谁选对了通往AGI的正确路径”。不同于多数玩家的退缩与路径妥协,昆仑万维旗下的昆仑天工,没有选择向后撤退,也没有局限于短期落地的浅层路径,而是坚定选择了全模态输入与全模态输出这一终极方向,朝着AGI的终极目标一路跟到底。
这份坚持的背后,从来不是盲目乐观,而是源于昆仑天工贯通AI产业链上下游的深厚积淀,更是其对“数据密度×算法精度×场景厚度”乘积效应的深刻认知。昆仑天工认为,未来AI产业的竞争,早已告别单一维度的比拼,而是进入“乘积效应”的竞争时代——数据密度决定了模型的训练质量,算法精度决定了模型的核心性能,场景厚度决定了技术的落地价值,三者相辅相成、缺一不可,只有实现三者的有机结合,才能真正推进AGI的落地。
而高质量的垂类数据,更是打破“技术停留在Demo、无法落地业务”的关键突破口——脱离了真实场景的垂类数据,再精密的算法也只是空中楼阁,无法创造真正的商业价值;而唯有扎根行业、沉淀足够多的高质量垂类数据,才能让AI技术从“实验室”走进“产业场”,实现从技术到价值的转化。也正因为如此,昆仑天工始终注重在真实商业场景中沉淀数据,这也成为其敢于“all in”全模态路径的核心底气。
目前,国内真正具备全模态完整布局与落地能力的企业,寥寥无几,仅有字节跳动与昆仑天工等公司。这些企业的共同优势,在于既具备强大的底层模型研发能力,又拥有丰富的场景资源与数据积淀,能够实现“技术-商业”的闭环,持续推进全模态技术的迭代与落地;而两者的差异化在于,字节跳动依托自身的流量生态,聚焦C端场景的全模态落地,而昆仑天工则依托昆仑万维的出海优势与垂直场景积淀,聚焦“全模态+出海”和“全模态+垂直产业”的落地,走出了一条独具特色的全模态发展之路。
![]()
在AI行业,很多企业的全模态布局停留在“概念炒作”层面,动辄宣称“实现全模态突破”,却拿不出实质性的落地案例与数据支撑,最终只能沦为“昙花一现”。而昆仑天工的全模态布局,从不玩概念、不搞噱头,始终坚持“务实落地、商业变现”的核心原则,其全模态输入输出的AGI业务形态,早已通过昆仑万维的财报数据与各业务线的实绩,得到了充分验证,用实打实的数字,彰显了自身的硬实力。
昆仑天工以实现AGI为核心愿景,构建了全面且深入的全模态布局,自研并发布了8大核心大模型,覆盖文本、多模态、视频、音乐、音频、3D、代码、Agent等多个核心领域,多项AI业务进行了密集迭代。例如,发布多模态推理模型Skywork-R1V 3.0;发布并开源自回归多模态统一模型Skywork UniPic,又推出升级版Skywork UniPic2.0;开源3D世界生成模型Matrix-3D;发布天工超级智能体核心引擎Skywork Deep Research Agent V2等,形成了“底层架构-技术能力-场景落地”的完整体系,实现了从技术研发到商业变现的闭环,每个模态的技术都有对应的落地场景与商业回报,真正做到了“技术有用、商业可行”。
其次,从各全模态业务线的具体数据来看,昆仑天工的全模态技术已经实现了规模化落地,每个业务线都取得了亮眼的成绩,形成了多点开花的格局:
Skywork Super Agents天工超级智能体(多模态核心落地产品):天工超级智能体目前已连接430家权威机构的数据源,涵盖政务、金融、教育、医疗等多个垂直领域,能够为用户提供可信、可溯源、可定制的专业信息支持与多模态办公赋能。Skywork Super Agents能够一站式生成文档、PPT、excel、网页、播客和音视频多模态内容,在GAIA榜单上排名全球第一,以“5分钟生成30页可溯源PPT”的核心能力收获市场青睐,40%的日活用户钟情于这一效率革命工具,真正实现了“AI Office智能体”对传统办公模式的颠覆。2月4日,昆仑天工面向全球发布天工Skywork桌面版,即桌面端应用Skywork Desktop。
![]()
「天工Skywork桌面版」直接在本地执行任务,无需上传文件到云端。它可以直接读取电脑上的海量文件,进行汇总、整理,并基于内容生成新产物。同时,它以“内容理解”为核心,而非“文件格式”:无论是图片、视频、表格、PPT 还是各类文档文件,都能在统一语义层下被理解、归类、执行任务,且支持多任务并行。
AI音乐Mureka(音乐+音频模态核心落地产品):作为昆仑天工在音乐、音频模态的核心布局,Mureka系列模型(含最新发布的V8版本)依托MusiCoT技术体系,实现了AI音乐、AI音频的专业级生成。Mureka年化流水约1200万美元,全球访问量增速稳居行业第一,2025年11月首次实现扣减营销费后毛利为正,标志着AI音乐业务已经实现了可持续的商业变现。目前,Mureka系列模型已广泛应用于音乐发行、短视频配乐、影视配乐、游戏配乐等多个场景,与海内外众多中小音乐公司、短视频平台达成合作,成为音频创作领域的核心工具。
AI社交Linky(多模态+AI社交模态核心落地产品):Linky作为昆仑天工全模态技术在社交领域的落地载体,融合了语言、图像、音频、视频等多种模态能力,为全球用户提供多模态的社交体验,用户可以通过等多种方式进行互动,还可以通过AI生成个性化的社交内容(如AI头像、AI短视频、AI语音)。截至2025年三季度末,Linky累计下载量突破2000万次,覆盖全球100多个国家和地区,单月最高收入超100万美元,其中海外收入占比高达95%,成为昆仑天工全模态业务出海的又一核心抓手。
3D大模型与代码大模型(前瞻布局模态):除了已实现规模化落地的业务线,昆仑天工在3D、代码等前瞻模态的布局也在稳步推进。其中,3D大模型目前已实现简单3D模型的生成与虚拟场景的搭建,能够应用于游戏制作、虚拟人等场景,目前正与多家游戏公司达成合作,进行试点落地;SWE代码大模型则具备强大的代码生成、调试、优化能力,能够支持多种编程语言,为程序员提供高效的开发辅助,目前已接入多家科技公司的开发流程,大幅提升了开发效率。
昆仑天工全模态业务能够实现多点开花、规模化变现,核心优势在于其底层统一的全模态架构——不同于其他企业的“多模态拼接”路线,昆仑天工打造了支持全模态处理的统一大模型架构,打破了不同模态之间的数据壁垒,实现了文本、图像、音频、视频、3D等多模态数据的原生理解与协同生成。这种底层统一的架构,不仅提升了模型的训练效率与性能,更实现了不同模态技术的协同联动,让全模态能力能够更好地适配复杂的真实场景。
与此同时,昆仑天工的全模态布局,始终依托真实商业场景沉淀的垂类数据,形成了“研发-落地-变现-迭代”的良性闭环。依托昆仑万维的生态积淀,昆仑天工扎根AI短剧、AI音乐、AI社交等多个垂直领域,构建了成体系的产品线,沉淀了海量高质量的多模态垂类数据——这些数据与真实商业场景深度绑定,涵盖不同国家、不同行业、不同用户的需求,成为其全模态模型迭代的核心“燃料”。通过这些数据的反馈,昆仑天工能够快速优化模型性能,提升技术的落地适配能力,进而推动商业变现,再将商业变现的收益投入到研发中,形成良性循环,为其持续推进AGI落地提供了持续的动力支撑。
![]()
客观而言,现阶段的全模态探索仍处于进阶阶段,无论是昆仑天工还是其他少数践行者,都尚未在底层模型上实现对所有模态数据的统一原生处理,距离真正的AGI还有很长的路要走。但不可忽视的是,昆仑天工已经在应用和产品层面,构建了整合多模态能力、服务于完整场景的成熟体系,实现了多个领域的局部突破与验证,相较于国内其他玩家,已经形成了明显的差异化优势。
现阶段,昆仑天工面临的核心考验,将是如何把这些局部的成功,扩展为跨模态、跨场景的协同智能,如何进一步提升模型在开放场景中的泛化能力。具体而言,就是如何让不同模态的技术更好地协同联动,比如让AI短剧的剧本生成、音频合成、视频制作实现更精准的匹配,让AI音乐能够更好地适配AI短剧、AI社交等场景,让全模态模型能够快速适配新的行业场景,满足不同用户的个性化需求。这既是其全模态布局能否最终获胜的关键,也是其通向AGI的核心必经之路。
面对这一考验,昆仑天工的差异化破局之道,就在于其“务实落地”的核心理念——不追求“虚无缥缈”的技术噱头,不盲目对标巨头的长板,而是始终保持清醒的自我认知,避开算力内卷的红海,像敏锐的开拓者般,主动探寻未被挖掘的市场蓝海,聚焦自身优势,打造差异化竞争力,这也是它被媒体赋予“AI现实主义者”这一鲜明标签的核心原因。
在巨头林立的AI行业,昆仑天工的差异化优势主要体现在三个方面:
第一,战略差异化:避开巨头内卷,聚焦“全模态+出海”的蓝海赛道。
当前,国内AI巨头大多聚焦于国内C端流量场景,陷入了算力比拼、流量争夺的内卷红海,而昆仑天工聚焦海外中小市场与垂直场景。海外中小市场虽然单个市场规模不大,但整体市场空间广阔,且缺乏强大的本土AI玩家,巨头的布局也相对薄弱,昆仑天工的全模态技术,恰好能够满足海外中小用户、中小商家的需求,比如海外短视频创作者的配乐需求、中小商家的AI营销内容生成需求等,从而快速实现市场渗透,形成差异化的竞争优势。截至目前,昆仑天工的全模态业务已覆盖全球150多个国家和地区,海外收入占比高达93%以上,成为国内AI企业出海的标杆。
第二,路径差异化:拒绝“伪多模态”,坚持底层统一的全模态架构。如前文所述,当前很多企业的多模态布局都是“拼接式”的,缺乏底层统一架构,无法实现跨模态协同,而昆仑天工则坚持打造底层统一的全模态架构,从根源上实现多模态数据的原生理解与生成,这种路径虽然难度更大、投入更高,但却是最接近AGI终极形态的路径,也是最具长期竞争力的路径。随着技术的持续迭代,这种底层架构的优势将愈发明显,能够更好地支撑跨模态、跨场景的协同智能,实现从“专用智能”向“通用智能”的跨越。
第三,商业差异化:坚持“技术-商业”闭环,拒绝“纯研发烧钱”。不同于国内部分AI企业“只研发、不落地”“烧钱换流量”的模式,昆仑天工始终坚持“技术落地为先、商业变现为王”的理念,每一项全模态技术的研发,都对应着明确的商业场景,每一个大模型的发布,都有对应的落地产品与变现路径。从AI短剧、AI音乐,到AI社交,昆仑天工的全模态技术已经实现了规模化的商业变现,形成了“研发-落地-变现-迭代”的良性闭环,能够依靠自身的商业收益,持续支撑研发投入,无需过度依赖融资,这种“务实落地”的商业模式,让其在行业周期波动中,能够保持稳定的发展态势,也让其能够持续推进AGI的长期布局。
除此之外,昆仑天工的差异化优势,还源于其贯通AI产业链上下游的完整布局。昆仑天工的AI短剧、AI音乐产品,能够通过昆仑万维的海外分发渠道,快速触达全球用户;昆仑天工的全模态技术,能够与昆仑万维的游戏、社交等业务深度融合,实现协同发展,进一步提升商业价值。这种产业链上下游的协同优势,是很多纯研发型AI企业无法比拟的,也是昆仑天工能够快速实现全模态技术落地与商业变现的核心支撑。
展望未来,AGI的道路或许漫长且充满荆棘,算力、数据、算法的瓶颈仍将在很长一段时间内存在,行业的质疑声也不会消失,但选择了正确路径、手握核心筹码的昆仑天工,已然站在了AGI赛道的前列。随着全模态技术的持续迭代与场景落地的不断深化,昆仑天工有望逐步突破技术瓶颈,实现跨模态、跨场景的协同智能,进一步完善全模态布局,推动全模态技术在更多垂直领域的落地应用,创造更大的商业价值。
如果未来五年,国内要跑出能够在商业化落地与复杂场景应用中,持续验证AGI能力的标杆样本,那么昆仑天工无疑是最具潜力的竞争者之一。作为国内少数真正践行全模态输入与全模态输出的玩家,它具备底层统一的模型架构、全面的多模态布局、海量的垂类数据积淀,以及成熟的商业闭环能力。这种“技术研发-场景落地-商业变现-数据沉淀”的良性循环,正是推进AGI落地最需要的核心能力,也让昆仑天工在通向AGI的道路上,走得比多数玩家更稳、更远。
- 往期爆款 -
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.