网易首页 > 网易号 > 正文 申请入驻

中信建投:AI多模态和世界模型或重塑多个行业的业务逻辑

0
分享至

智通财经APP获悉,中信建投发布研报称,作为全球多模态技术相对领先的厂商,谷歌、快手等头部模型重点解决了角色一致性与物理逻辑难题,快手可灵月活破千万并实现订阅收入增长,标志着多模态工具从娱乐走向生产力。应用侧,AI漫剧接棒短剧成为新增长极,字节跳动等平台通过高额激励推动内容精品化,AI加速IP影视化进程,有望催生新的市场机遇,重塑广告与游戏资产生产逻辑。展望未来,原生多模态与世界模型技术共同演进,有望重塑营销、影视、游戏等下游产业格局。

中信建投主要观点如下:

作为全球多模态技术相对领先的厂商,谷歌Veo、Gemini、Nanobanana等系列模型在超长上下文理解与原生音视频融合领域确立了深厚壁垒,国内快手可灵、MiniMax海螺、阿里通义万相及智谱等头部玩家亦通过架构和技术革新,重点解决了视频生成中长期存在的角色一致性失控、物理逻辑崩坏以及分镜不可控等工业化生产难题,加速促进多模态技术商业化变革:

海螺AI:MiniMax(00100)10月28日更新的Hailuo2.3系列模型重点聚焦物理稳定性与全模态协作,解决了大动态运镜下的物理崩坏问题,大规模运动指令下对光影方向、明暗过渡及物理碰撞逻辑的模拟已接近实拍质感,尤其在复杂肢体动作如精细抓取与手指交叉方面展现了极高的稳定性。海螺Media Agent则进一步将视频、语音及语言模型封装为统一的智能体,支持在无限画布中通过自然语言协作。用户仅需输入简单的商业创意,Agent即可自主完成脚本生成、视频渲染与音效配置。

可灵AI:快手(01024)可灵12月1日发布的o1是行业内首个将多种创作任务整合进统一引擎的视频大模型。该模型基于多模态视觉语言理念,将参考图生视频、内容增删、风格重绘等功能融合,解决了过去创作中功能割裂的问题。根据快手内部测试数据,可灵o1在图片参考任务中的胜负比达到247%,在指令变换任务中的胜负比达到230%,在理解复杂创作意图方面表现突出。可灵视频2.6模型则进一步强化了音频同步与动作控制能力,支持在生成视频的同时直出自然语言对话与音效,并具备针对手势、表情及肢体动作的精细化驱动。据实测,可灵2.6支持长达30秒的复杂武打动作控制,且在生成过程中可维持音色的一致性,使得视频生成可控性进一步增强。

阿里通义万相:阿里于2025年12月26日正式发布通义万相2.6系列模型,通过多模态联合建模技术,实现了国内首个商业化角色扮演功能。具体而言,万相2.6通过提取参考视频中的主体情绪、姿态及声学特征,在生成阶段作为约束条件,确保了角色在不同镜头间的一致性,解决了影视创作中IP形象易闪烁的痛点。在叙事控制方面,万相2.6引入了专业的分镜控制公式,能够理解高层语义逻辑,将文本自动拆解为远景环境、中景动作与近景特写等专业镜头组合。目前,万相2.6支持单次生成15秒的高清视频,为国内当前公开测试的最高指标,其对镜头节奏与画面氛围的高一致性建模,为专业导演提供了可量产的数字生产工具。

智谱:2026年1月14日,智谱(02513)AI联合华为发布的GLM-Image,成为首个在国产全栈算力底座上完成全流程训练的SOTA图像生成模型,验证了国产昇腾芯片与昇思框架在大模型训练中的可靠性。技术方面,GLM-Image模型采用自回归理解结合扩散解码的混合架构,兼顾了宏观逻辑理解与微观细节刻画,在处理知识密集型场景时表现优异,特别是在复杂的海报排版、带有数据信息的图表生成方面,解决了汉字渲染乱码的行业难题。此外,GLM-Image模型原生支持1024x1024至2048x2048的任意比例输出,且能理解具有推理性质的创作指令,API调用模式下生成一张图片仅需0.1元,极具性价比优势。

产业端,模型能力的突破已带动社区传播与商业化落地。快手可灵2.6“动作控制”功能驱动了以宠物跳舞为代表的现象级视频在全球范围内的爆火,不仅带动了C端用户的涌入,更直接转化为了订阅收入。根据晚点独家调研数据,可灵AI的月活跃用户数在2026年1月已突破1200万;截至2026年1月20日,可灵App端付费用户规模环比增长达350%,1月的日均收入较12月日均高出约 30%(2025 年 12 月可灵单月收入超过 2000 万美元)。从收入构成看,2025年可灵全年收入预计达1.4亿美元,其中专业生产者贡献了近70%的份额,这与快手一直以来瞄准P端(自媒体视频创作者、广告从业人员等)用户的战略相一致——即多模态AI工具已脱离娱乐属性,成为影视、广告等行业从业者的生产力标配,初步形成商业闭环。

AI漫剧则成为了继短剧之后视频生成应用的又一场景,字节跳动等头部平台正通过激进的激励政策推动AI内容精品化。以抖音短剧版权中心为例,其2025年12月16日推出了“漫剧创作激励计划”,对使用豆包大模型制作漫剧的机构提供15%的技术成本补贴;而后,抖音进一步加码漫剧创作激励,给予S+漫剧保底激励5000元/分,单部剧保底50万-75万,超头部作品最高分成达30000元/分;同时平台开放了番茄小说超过6万部优质IP库,并全额补贴改编费用。数据显示,2025 年 9 月红果短剧月活用户约 2.36 亿,超过了B 站和优酷,接近芒果TV;而从市场规模来看,短剧今年有望突破千亿,漫剧有望突破200亿,展现出巨大的潜力。从短剧的视频素材生成到完整漫剧生成,AI技术正催生全新的产业生态,逐步产生商业化价值。

展望未来,多模态技术一方面向视频、音频、图像、文本统一的原生多模态发展,另一方面则向具备物理常识与逻辑推理的世界模型演进。前者强调AI能在一套框架下对各种模态进行统一处理;后者则意味着AI能够像人类大脑一样根据当前画面预测下一帧会发生什么。

而在应用场景的延伸上,原生多模态和世界模型都将重塑多个行业的业务逻辑。例如在搜索与营销领域,最近正发生SEO到GEO的变化,未来可能进一步发展为生成式视觉检索,不仅可以搜图,还可以直接获得AI实时生成的定制化视频作为回答;而在文娱板块,短剧、漫剧已呈现快速放量的趋势,小说IP+AI视频的组合能够加速IP影视化过程;游戏产业同样深受生成式AI影响,目前头部公司纷纷将AI应用于美术资产的辅助生产,未来在世界模型的加持下,实时游戏引擎也将成为可能,带来类“头号玩家”的元宇宙开放世界游戏体验。

风险提示:

AI产业商业化落地不及预期;市场竞争风险;地缘政治风险。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一座副省级城市有多少位正厅级干部?——以青岛为例

一座副省级城市有多少位正厅级干部?——以青岛为例

据说无据
2026-03-24 16:29:53
黄仁勋呼吁所有人使用AI提升自己:大学生毕业时都要成AI专家

黄仁勋呼吁所有人使用AI提升自己:大学生毕业时都要成AI专家

快科技
2026-03-24 22:46:04
3月26日俄乌最新:靴子终于落地了

3月26日俄乌最新:靴子终于落地了

西楼饮月
2026-03-26 19:48:54
张柏芝机场接大儿子,Lucas主动帮妈妈拎包,母子相拥热聊关系好

张柏芝机场接大儿子,Lucas主动帮妈妈拎包,母子相拥热聊关系好

白面书誏
2026-03-26 13:38:29
吴石牺牲后,蒋介石还不解恨,又处分了当时已经退隐状态的白崇禧

吴石牺牲后,蒋介石还不解恨,又处分了当时已经退隐状态的白崇禧

云霄纪史观
2026-03-26 18:04:39
奥恰洛夫:我从圈内听说,樊振东明年甚至有可能再换一次俱乐部

奥恰洛夫:我从圈内听说,樊振东明年甚至有可能再换一次俱乐部

懂球帝
2026-03-26 11:24:21
就在今天!火箭创NBA历史第一耻辱纪录,输球后苏群王猛火力全开

就在今天!火箭创NBA历史第一耻辱纪录,输球后苏群王猛火力全开

米果说识
2026-03-26 20:24:31
特朗普万万没想到!第一个敢掀桌子的,竟然是马来西亚

特朗普万万没想到!第一个敢掀桌子的,竟然是马来西亚

黑鹰观军事
2026-03-25 17:12:13
去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

千秋文化
2026-03-24 21:40:40
中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

长风文史
2026-03-25 17:58:23
阚清子产后现身机场!手上鸽子蛋大钻戒抢镜,富豪老公拎包似保姆

阚清子产后现身机场!手上鸽子蛋大钻戒抢镜,富豪老公拎包似保姆

老好人的愤怒
2026-03-26 18:02:04
薛之谦惹争议!挚友张雪峰离世毫无表示,知情人曝原因!

薛之谦惹争议!挚友张雪峰离世毫无表示,知情人曝原因!

古希腊掌管松饼的神
2026-03-25 22:39:53
曝字母哥雄鹿今夏大概率分手!4年2.7亿美元不续了?双方仍在僵持

曝字母哥雄鹿今夏大概率分手!4年2.7亿美元不续了?双方仍在僵持

罗说NBA
2026-03-26 20:51:40
古代用长枪最厉害的四大名将,赵子龙上榜,第一名恐怕无人能敌

古代用长枪最厉害的四大名将,赵子龙上榜,第一名恐怕无人能敌

铭记历史呀
2026-03-26 11:22:56
美伊冲突,已经出现了3个赢家,10个输家,都是谁?

美伊冲突,已经出现了3个赢家,10个输家,都是谁?

七号说三国
2026-03-25 21:11:29
关于美伊和谈,华尔街有些“冷水”要泼!

关于美伊和谈,华尔街有些“冷水”要泼!

财联社
2026-03-26 08:36:24
国防部:菲方侵权挑衅只会遭到更加坚决应对

国防部:菲方侵权挑衅只会遭到更加坚决应对

界面新闻
2026-03-26 16:00:27
为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

廖保平
2026-03-17 09:04:38
伊朗:正在审议停火方案

伊朗:正在审议停火方案

亚太观澜
2026-03-26 20:35:03
车市太卷了!2026款锋兰达上市就降价,油耗4.5L,9万开走

车市太卷了!2026款锋兰达上市就降价,油耗4.5L,9万开走

念寒车评
2026-03-26 17:19:03
2026-03-26 21:11:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1106809文章数 101264关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
家居
艺术
时尚
本地

教育要闻

来上课了——高考阅读难题大综合(细节+主旨+含义)(下)第1段

家居要闻

傍海而居 静观蝴蝶海

艺术要闻

哪一座桥不是风景?

上新|| 她们说,找到了自己的人生裙子!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

无障碍浏览 进入关怀版