网易首页 > 网易号 > 正文 申请入驻

谷歌Veo3破局!视觉模型零样本崛起,CoF开启通用时代

0
分享至



这篇来自谷歌DeepMind的《Videomodelsarezero-shotlearnersandreasoners》,直接抛出重磅信号:视觉领域的“GPT时刻”要来了。



以前做视觉相关的活儿别提多麻烦了。

这些模型各立门户,架构差异大得很,开发起来又费钱又费力,泛化能力还弱。

搞视觉的朋友怕是最有体会,明明都是处理图像视频,却得在不同模型间来回切换,效率低得让人头疼。



Veo3的出现直接打破了这种僵局。

本来想,这种“全能选手”会不会在某些任务上表现拉胯?但实际情况是,不管是理解物体物理属性、识别使用场景,还是模拟工具操作,它都能应对。



如此看来,视觉模型从“专才”变“通才”,还真不是空喊口号。

Veo3最让人眼前一亮的,还不是它能搞定多少任务,而是它的推理方式。

以前的视觉模型,输入数据后直接出结果,中间的思考过程跟黑箱似的,根本不知道它是怎么得出答案的。

现在不一样了,Veo3引入了Chain-of-Frames(CoF)机制,有点像语言模型的思维链,但它是用连续的视频帧把推理过程“演”出来。



比如解迷宫的时候,模型不会一次性给出路径,而是通过逐帧调整画面,一步步逼近正确答案。

这些连续的视觉变化,替代了抽象的符号推理,推理逻辑就藏在视频序列里。

这种“逐帧生成即推理”的方式太妙了。

模型不用再围着单个任务算结果,而是在统一的生成过程中,不断更新对场景的理解。



不同任务的差异,变成了生成时该关注什么、怎么继续生成的区别。

这样一来,分割、检测、路径规划这些原本不相干的任务,都能被统一到同一套生成机制里,自然不用再为每个任务单独设计模型。

Veo3的突破,让不少行业大佬都坐不住了。

阿里P10林俊旸说,视频不再只是输出形式,更开始体现推理过程。



a16z投资合伙人JustineMoore也提到,这事儿有点当年LLM颠覆NLP的味道。

毫无疑问,现在的视觉领域,正走着LLM曾经走过的路。

NLP以前也是翻译、写作、问答各有专属模型,LLM出现后,靠大规模数据训练实现了零样本通用能力,彻底改变了行业格局。

如今Veo3在视觉领域做到了类似的事情,这意味着通用视觉基础模型的时代越来越近了。



最近这段时间,Meta、OpenAI等机构也在视觉通用模型上动作频频,显然大家都嗅到了行业变革的气息。

未来,机器人视觉导航、自动驾驶场景决策、创意设计自动化这些领域,都可能因为这类模型迎来新变化。

但话说回来,挑战也真实存在。

大规模视频数据训练对计算资源的消耗不小,复杂场景下的任务精度还有提升空间,跨模态提示的精准度也得进一步优化。



并非明智之举的是,现在就过分夸大它的能力,毕竟技术落地还需要时间打磨。

Veo3的零样本效能和CoF推理机制,确实给视觉AI带来了突破性进展。它不仅破解了多任务统一的长期难题,还让模型推理从黑箱变得可见。

视觉领域的“GPT时刻”已经有了实质性的爆发迹象,接下来就看技术如何落地,如何更好地融入生产生活。

相信随着不断优化,通用视觉AI会解锁更多创新应用,给我们的生活带来实实在在的改变。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宁夏银川警方:一男子因琐事发生口角持刀将同小区居民捅伤致死,已被刑拘

宁夏银川警方:一男子因琐事发生口角持刀将同小区居民捅伤致死,已被刑拘

环球网资讯
2026-02-01 11:55:40
56岁退休护士的劝告:仅把退休金作为养老依仗,老年生活会很糟糕

56岁退休护士的劝告:仅把退休金作为养老依仗,老年生活会很糟糕

热心柚子姐姐
2026-01-30 16:47:49
一封来自美国的“情书”:开了中国电车,再也不想美国车

一封来自美国的“情书”:开了中国电车,再也不想美国车

观察者网
2026-01-30 15:27:19
历代皇室为何把王莽的头颅当宝贝,前后收藏了272年,它有何特别

历代皇室为何把王莽的头颅当宝贝,前后收藏了272年,它有何特别

千秋文化
2026-01-30 21:47:10
保姆想让雇主嫁给儿子这是啥心理?网友:这算盘打得好 想身份互换

保姆想让雇主嫁给儿子这是啥心理?网友:这算盘打得好 想身份互换

另子维爱读史
2026-01-30 18:18:16
周末这两大重要消息,对2月A股的开局走势很关键

周末这两大重要消息,对2月A股的开局走势很关键

每经牛眼
2026-02-01 14:15:20
初中各科淘汰的规律:数学满分120,考不到110分的,重高基本没戏

初中各科淘汰的规律:数学满分120,考不到110分的,重高基本没戏

好爸育儿
2026-01-31 19:33:28
颠沛流离!施罗德将效力生涯第11支球队,近五年已换9次东家

颠沛流离!施罗德将效力生涯第11支球队,近五年已换9次东家

林子说事
2026-02-01 12:47:27
毛主席对尼泊尔首相说:你想把珠峰全部划归贵国?还有更好的办法

毛主席对尼泊尔首相说:你想把珠峰全部划归贵国?还有更好的办法

鹤羽说个事
2025-10-30 15:53:46
著名演员谭凯卖掉北京房产、注销北京户口,回青岛开一家饺子馆

著名演员谭凯卖掉北京房产、注销北京户口,回青岛开一家饺子馆

阿雹娱乐
2026-01-22 14:20:50
李亚鹏1月30日直播位居榜首,带货超亿元,5月将推出自有茶叶品牌

李亚鹏1月30日直播位居榜首,带货超亿元,5月将推出自有茶叶品牌

城事记录
2026-01-31 18:07:28
这个世界怎么变成了足控的样子?

这个世界怎么变成了足控的样子?

3DM游戏
2026-02-01 12:07:03
女演员自曝4元/克买的白银,存在银行忘了,13年后才想起来!需补交7000多元

女演员自曝4元/克买的白银,存在银行忘了,13年后才想起来!需补交7000多元

扬子晚报
2026-02-01 10:11:33
中超最成功转会:金玟哉有望给国安带来6200万元总收入!

中超最成功转会:金玟哉有望给国安带来6200万元总收入!

邱泽云
2026-01-31 18:46:05
失业后我才发现:从古至今,赚钱最快的路子就一个,从未改变

失业后我才发现:从古至今,赚钱最快的路子就一个,从未改变

另子维爱读史
2026-01-16 21:23:39
在中国拿23亿,访日本仅半天!斯塔默:只看钱不看人

在中国拿23亿,访日本仅半天!斯塔默:只看钱不看人

爱意随风起呀
2026-02-01 13:58:25
布克复出?快船客场战太阳压力大,博格丹回归助哈登,狄龙锁小卡

布克复出?快船客场战太阳压力大,博格丹回归助哈登,狄龙锁小卡

一登侃球
2026-02-01 10:49:10
南海撞机王伟成功跳伞,咋10万人都找不到他?直到20多年后才明白

南海撞机王伟成功跳伞,咋10万人都找不到他?直到20多年后才明白

鹤羽说个事
2025-12-12 14:31:49
舅舅在银行工作叮嘱我:2026年存钱,这5点一定要记住

舅舅在银行工作叮嘱我:2026年存钱,这5点一定要记住

三农老历
2026-02-01 12:50:46
被删?刘亦菲小龙女“湿身骑马”原图在这里

被删?刘亦菲小龙女“湿身骑马”原图在这里

东方不败然多多
2026-01-31 07:30:56
2026-02-01 15:39:00
时光在作祟
时光在作祟
时光在作祟
252文章数 293关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

马斯克曾问爱泼斯坦:岛上哪一晚会有"最疯狂的派对"

头条要闻

马斯克曾问爱泼斯坦:岛上哪一晚会有"最疯狂的派对"

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

家居
时尚
旅游
教育
房产

家居要闻

蓝调空舍 自由与个性

伊姐周六热推:电视剧《年少有为》;电视剧《有罪之身》......

旅游要闻

视界|探访格鲁吉亚哥里城堡

教育要闻

10秒钟学会绝对值

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

无障碍浏览 进入关怀版