网易首页 > 网易号 > 正文 申请入驻

智源大会前线速写:多模态模型的“ChatGPT时刻”还未到来

0
分享至

图片来源:视觉中国

蓝鲸新闻6月8日讯(记者 朱俊熹)回顾生成式AI的演进历程,除大语言模型的爆发外,还有一条并行推进的技术路线:多模态大模型。过去一两年间,多模态路线上先后出现OpenAI的视频生成模型Sora、4o图像生成功能等重要里程碑。但在6月6日至7日的2025北京智源大会上,业界人士的主流观点是:属于多模态的"ChatGPT时刻"尚未到来。

智源研究院院长王仲远表示,当前的多模态模型大多是对静态画面的理解,描述的是存在的事实。但人类对多模态的理解并不是基于单帧图像的描述,而是可以从一个画面预测下一个可能的画面。"当我手接近水时,可以预测我要拿水;如果不小心把它碰倒在地板上时,会预测水洒下去。如果没有盖子,地板会被水洒湿。"

在AI视频创企Sand.ai创始人兼CEO曹越看来,要想精准地预测并生成未来的视频内容,关键在于对过去视频内容的充分理解。为此,Sand.ai将主要探索方向押注在自回归这一技术路径上。当下的多模态生成领域中,DiT架构,即基于Transformer架构的扩散模型是主流选择。如果说DiT是逐步去噪来还原图像或视频,自回归则是按顺序逐帧、逐块地生成图像或视频。

曹越指出,沿着DiT架构方向会发现,随着模型大小提升,将快速达到瓶颈,需要找到可扩展的解决方案。如果将自回归的思路引入视频生成方向,可能会有显著不同的体验。其训练方式本质就是基于之前一段视频,来生成未来的一段视频。因此生成视频时长可从现在的5秒提升至几分钟,存在较大的技术提升空间。

今年4月,OpenAI研究科学家姚顺雨的一篇长帖曾引发热议。他表示,AI已进入下半场,重心将从解决问题转向定义问题。在智源大会分论坛上,AI视觉领域的明星创企Luma AI首席科学家宋佳铭直言,"上下半场"的划分更像是在描述语言模型。如果上半场是预训练,下半场是推理,目前多模态模型还未能很好地解决上半场的问题。

宋佳铭解释称,对于上半场的期望是,多模态模型能够通过一个大一统的模型,像人一样处理不同模态的任务,并且保持足够快的推理速度。这个模型应当具备多模态思维链,否则在下半场无法真正打通推理能力。

如果从多模态模型的应用落地角度来看,腾讯混元多模态生成负责人芦清林认为,上下半场的分界线并不清晰。"因为五分的模型对应五分的用法,八分的模型对应八分的用法。"他表示。一个判定信号是,专业领域的人是否开始使用这项技术。即便技术研发人员认为模型还存在很多可改进的地方,如果专业人员已经开始采用,并且觉得能在实际工作中带来提效或帮助,那么它已经达到了能带来实际改变的阶段。

字节跳动Seed图像&视频生成负责人黄伟林则分享了判断技术商业化程度的三个数据指标。一是效率数据,如用户在使用AI生图时,生成多少张图片会下载一张。二是APP上的用户留存数据。三是收入数据,他指出头部AI视频产品ARR(年度经常性收入)年底有望达到1亿美元或更多,明年将可能实现5到10倍的增长。

在技术和商业的结合层面,Sand.ai联合创始人张拯强调,应当追求有效的Scaling Law。即在扩展模型规模、提升性能时,由此带来的用户价值和经济回报是否足以覆盖所投入的资源成本。如果模型能力提升的代价过高,用户得不到对应的回报,那么从商业角度来看,这样的Scaling就是无效的。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏拟建一条过江通道,或将再破“世界纪录”

江苏拟建一条过江通道,或将再破“世界纪录”

水泥土的搞笑
2026-03-26 14:04:59
破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

后仰大风车
2026-03-26 08:15:08
中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

信网
2026-03-26 19:12:37
山西太原一学校职工举报自己吃空饷6年,多方回应

山西太原一学校职工举报自己吃空饷6年,多方回应

大风新闻
2026-03-26 15:41:15
1959年杜聿明被特赦,老蒋得知大惊道:快让他老婆从美国回来!

1959年杜聿明被特赦,老蒋得知大惊道:快让他老婆从美国回来!

新一说史
2026-03-26 17:42:42
中国3大长寿食物,茼蒿排第三;第一名天天见,却很少人爱吃

中国3大长寿食物,茼蒿排第三;第一名天天见,却很少人爱吃

荷兰豆爱健康
2026-03-26 14:21:32
陈羽凡现状:低调生活,50岁胖到认不出,17岁儿子1米8长得像妈

陈羽凡现状:低调生活,50岁胖到认不出,17岁儿子1米8长得像妈

三公子娱乐丫
2025-05-17 17:59:45
3月26日俄乌:乌克兰的猛烈回击

3月26日俄乌:乌克兰的猛烈回击

山河路口
2026-03-26 17:32:00
上海河道里惊现鳄鱼?已立牌警示!官方回应↗

上海河道里惊现鳄鱼?已立牌警示!官方回应↗

看看新闻Knews
2026-03-26 20:01:05
与特朗普密切关系损害了她,意大利总理梅洛尼公投失败,提前大选

与特朗普密切关系损害了她,意大利总理梅洛尼公投失败,提前大选

越过海面
2026-03-26 10:32:58
血管狭窄超90%,重油重腻且生活不规律,假如第一时间被抢救,张雪峰能活吗?

血管狭窄超90%,重油重腻且生活不规律,假如第一时间被抢救,张雪峰能活吗?

消化石医生
2026-03-26 12:52:28
别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

动物奇奇怪怪
2026-03-25 14:18:48
伊朗接招了,反抛出5条停火条件,看来已经做好最坏打算了

伊朗接招了,反抛出5条停火条件,看来已经做好最坏打算了

罗富强说
2026-03-26 20:18:00
5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

叮当当科技
2026-03-20 03:29:51
张雪峰经典语录:句句都是人间清醒

张雪峰经典语录:句句都是人间清醒

山东教育
2026-03-26 08:07:56
麦迪:杨瀚森球商高有注定长期竞争力,打法让我想到约基奇

麦迪:杨瀚森球商高有注定长期竞争力,打法让我想到约基奇

懂球帝
2026-03-26 11:45:09
德邦将于3月31日退市并摘牌,并入京东物流后品牌独立运营

德邦将于3月31日退市并摘牌,并入京东物流后品牌独立运营

南方都市报
2026-03-26 11:30:07
“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

“我用房子贷的款却进了他们口袋”,佛山一男子称遭遇套路贷;警方立案侦查,3人被批捕后取保候审

大风新闻
2026-03-26 16:56:40
10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

10万亿窟窿!比恒大更坑的民企来了,曾力压许家印,位居第一

孤单是寂寞的毒
2026-03-04 15:38:03
张柏芝机场接大儿子,Lucas主动帮妈妈拎包,母子相拥热聊关系好

张柏芝机场接大儿子,Lucas主动帮妈妈拎包,母子相拥热聊关系好

白面书誏
2026-03-26 13:38:29
2026-03-26 20:48:49
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
128963文章数 193768关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
数码
本地
游戏
公开课

家居要闻

傍海而居 静观蝴蝶海

数码要闻

小米Book Pro 14超薄设计引爆市场!这家国产厂商立功了

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

10万奖池!2026 KKCS1.6 巅峰之路传奇联赛(春季赛)正式开赛!——KK官方对战平台

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版