网易首页 > 网易号 > 正文 申请入驻

AI爆点转移至多模态,体现了什么行业趋势?

0
分享至

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

2025年的AI爆点正在发生转移。

自DeepSeek R1上半年引爆行业情绪之后,“纯文本+推理”范式下的模型鲜少再现重量级成果。进入下半年,话题重心明显滑向多模态领域。

Sora 2被封装成可交付应用、谷歌推出图像编辑能力更强悍的Nano Banana;AI Agent这端同样如此,在Manus这样文本属性更突出的通用型产品之后,达到相近级别热度的是主攻视觉创作场景的LoveArt。

在这背后,文本模型的迭代进入一种基线较高、小步抬升的阶段,而多模态理解与生成能力在可用性上,向“破圈”层级又近了一步。

一名从事模型训练的研究人员对界面新闻记者指出,要理解这个现象,首先要认识到文本与多模态两个方向的研究是并行而非串行。

经过GPT-3、GPT-4、OpenAI o1等重大节点之后,大模型的语言理解能力足以交付C端(用户)应用,后续优化集中在稳态工程,例如对齐、降本、延迟优化、鲁棒性等等,这些能够进一步优化C端应用体验和B端(企业)商用价值,但用户感知不再像GPT-4来临时那样有强烈冲击。

一个典型的例子是DeepSeek-OCR。这是一个在话题性上不足以震撼人心的demo,但有其长期影响力。

DeepSeek-OCR在10月20日推出,定位于探索文本的视觉压缩能力(光学上下文压缩,Contexts Optical Compression)。简单而言,随着上下文输入增多,模型计算量以平方级陡增,但通过将长文本转化为图像识别,可以大幅压缩token计算数量。这一思路得到验证的成果是,它一旦落地到应用端,也是一个前景颇为确切的降本增效方式。

多模态这一侧完全不同,其能力曲线仍在还可以被更多人感知的区域内。不过,前述受访者指出,从并行的思路来看,多模态模型这端还未实现架构层级的突破,更多是足够的数据累积和训练技巧提升。


图源:界面新闻

正如他对Sora 2和Nano Banana的判断,除去OpenAI对多模态生成类产品的初步构想成型,以及谷歌对图像编辑器现阶段用户需求的把握(例如锚定一个点进行针对性修改),两款产品在生成质量上并未实现飞跃。

并且,在很大程度上,以“文生图、文生视频”为代表的多模态生成领域,其表现优化是以文本模型性能提升为前提。阶跃星辰创始人兼CEO姜大昕此前在接受界面新闻记者采访时指出,理解与生成之间的关系是,理解控制生成、而生成监督理解。

一级市场也在见证这种关注点切换。一名AI投资人对界面新闻记者表示,他的体感是今年行业整体投资事件增多,但投资规模在降低,这是投资重点由模型层向应用层过渡后,后者的市场规模及估值所决定的。

在这之中,今年最显眼的一笔来自应用层视觉创作领域的LiblibAI。10月23日,LiblibAI宣布完成1.3亿美元B轮融资,红杉中国、CMC资本等参与其中,促成今年国内资本市场AI应用赛道最大的一笔融资。这意味着相较其他赛道,团队的PMF(product-market-fit)更大程度受到资本认可。

在往后很长一段时间,业界能够期待的“爆点”或许都将更多来自于多模态领域。

姜大昕一直强调的观点是,光有语言的智能不够,多模态是大模型的必经之路。而在这片领域,理解与生成的统一仍是现阶段的突破点。

多名受访者曾对界面新闻记者表示,站在模型训练角度,视觉模态比文本模态面临的挑战更大。单从数据上来看,文本的表征可以在语义上自闭环,但视觉信息的表征需要先与文本对齐,不存在天然自闭环的数据,“可能需要几次像ChatGPT、强化学习范式这样的大技术变迁才能解决。”一名受访者说。

而一派观点认为,基于更好的多模态模型,世界模型、具身智能、空间智能等才能得到长足发展,行业才能进一步靠近AGI(通用人工智能)。

更现实的考量是,模型决定应用能力上限,在文本模型集中火力降本增效和缓慢提升性能的同时,多模态模型的突破有望给市场带来更多PMF机会,这将是创业者和投资人眼中更具实际价值的关键变化。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
75岁姜昆:如今和他46岁的女儿江珊一起生活,安稳又暖心

75岁姜昆:如今和他46岁的女儿江珊一起生活,安稳又暖心

手工制作阿歼
2026-03-13 00:40:42
国际油价大涨超9.22%,3月23日油价调整,汽柴油或大涨1300元/吨

国际油价大涨超9.22%,3月23日油价调整,汽柴油或大涨1300元/吨

油价早知道
2026-03-13 09:02:45
世界田联宣布吴艳妮无缘世锦赛,团队明显在压状态,亚运会定生死

世界田联宣布吴艳妮无缘世锦赛,团队明显在压状态,亚运会定生死

杨华评论
2026-03-13 16:15:07
日本七寸被找到!全国命脉仅一条线,一击便可瘫痪!

日本七寸被找到!全国命脉仅一条线,一击便可瘫痪!

门前小溪下
2026-03-14 05:34:45
以色列要被打成加沙了,美国智库分析,战争结果是中美会赢!

以色列要被打成加沙了,美国智库分析,战争结果是中美会赢!

起喜电影
2026-03-12 01:16:25
103胜24负!揭秘亚历山大连续127场20+含金量

103胜24负!揭秘亚历山大连续127场20+含金量

体坛周报
2026-03-13 17:26:20
官方出手,封杀名单再添新名,难怪两会中靳东、张凯丽都要这么说

官方出手,封杀名单再添新名,难怪两会中靳东、张凯丽都要这么说

天天热点见闻
2026-03-13 03:16:56
湖南新闻主持人离职后,沦为外卖骑手,戳破打工人就业的残酷现状

湖南新闻主持人离职后,沦为外卖骑手,戳破打工人就业的残酷现状

奇思妙想草叶君
2026-03-13 14:20:48
打了十来天,“最高强度”打击来了

打了十来天,“最高强度”打击来了

中国新闻周刊
2026-03-11 15:02:08
他来了!五个月的漫长等待,国米“最重要之人”回归

他来了!五个月的漫长等待,国米“最重要之人”回归

里芃芃体育
2026-03-14 05:00:04
美国专家不装了:如果中国找到治愈癌症的方法,那将是我们的噩梦

美国专家不装了:如果中国找到治愈癌症的方法,那将是我们的噩梦

宝哥精彩赛事
2026-03-14 02:27:00
中方接到了通知,特朗普修改访华规格,他要带领美国对华弯道超车

中方接到了通知,特朗普修改访华规格,他要带领美国对华弯道超车

霁寒飘雪
2026-03-13 10:25:17
特朗普搞砸了!美国将迎来最致命的战略反噬

特朗普搞砸了!美国将迎来最致命的战略反噬

云石
2026-03-13 20:36:10
意难平!得分赛季新高+超邓肯,无人问津啊,北境之王真的落寞了

意难平!得分赛季新高+超邓肯,无人问津啊,北境之王真的落寞了

球童无忌
2026-03-12 22:45:05
《我的山与海》看哭观众,王劲松:感谢傅彪27年前逼迫和临终叮嘱

《我的山与海》看哭观众,王劲松:感谢傅彪27年前逼迫和临终叮嘱

米椒影视
2026-03-12 12:11:53
这项运动“抗衰”效果被证实,大脑和皮肤都年轻了

这项运动“抗衰”效果被证实,大脑和皮肤都年轻了

齐鲁壹点
2026-03-12 07:33:14
周鸿祎力挺“龙虾”:不进步才是最大安全隐患

周鸿祎力挺“龙虾”:不进步才是最大安全隐患

中国经济网
2026-03-12 22:30:03
她拒唱国歌,否认中国籍,俩儿子也落户国外,如今她过得怎么样了

她拒唱国歌,否认中国籍,俩儿子也落户国外,如今她过得怎么样了

阅微札记
2026-02-25 16:56:12
过气男顶流沦为酒局“工具人”!全程讨好、倒酒赔笑,像一个商品

过气男顶流沦为酒局“工具人”!全程讨好、倒酒赔笑,像一个商品

涵豆说娱
2026-01-19 18:16:27
高价卖掉房的人,都将后悔?中央定调,2026年房价或开始一轮暴涨

高价卖掉房的人,都将后悔?中央定调,2026年房价或开始一轮暴涨

猫叔东山再起
2026-03-13 10:30:09
2026-03-14 07:23:00
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1036093文章数 1331211关注度
往期回顾 全部

科技要闻

龙虾热卷到AI硬件 “无脑”硬件或被淘汰

头条要闻

穆杰塔巴"亮相"没讲话 伊朗学者:其处境可能非常危险

头条要闻

穆杰塔巴"亮相"没讲话 伊朗学者:其处境可能非常危险

体育要闻

叕战奥运,张雨霏要做回“小将”

娱乐要闻

广电总局公布演员将用姓氏笔画定番位

财经要闻

“十五五”规划纲要,全文来了!

汽车要闻

置换补贴价8.68万 五菱缤果S 525km旗舰款上市

态度原创

健康
旅游
艺术
教育
亲子

转头就晕的耳石症,能开车上班吗?

旅游要闻

春满来凤山,花开迎客忙!腾冲茶花基地13万游人踏春“打卡”

艺术要闻

古代十大豪宅,放现在得值多少钱啊!

教育要闻

中华中学2026年招生工作正式启动!

亲子要闻

育儿思路:思考快与慢

无障碍浏览 进入关怀版