![]()
新智元报道
编辑:桃子 好困
【新智元导读】今天,谷歌原生视频模型Gemini Omni意外曝光!各种惊艳demo刷爆,教授黑板推导数学公式、一句话编辑视频,丝滑程度让全网破防。
谷歌I/O大会开幕在即,原生Gemini提前曝光!
如今,全网都被这个视频刷爆了——
一位教授在台上一边讲课,一边在黑板上随手推导公式,这质感、丝滑度,堪称惊艳。
实际上,这是由「全新视频模型」Gemini Omni生成,连贯性、一致性直接拉满。
有网友惊叹道,视频版Nano Banana来了!
![]()
还有人表示,眼见为实已经不存在了。
![]()
原生Gemini Omni,首次曝光了
![]()
就在昨天,Gemini移动端App主页截图流出,一个全新视频模型Gemini Omni入口上线。
界面中,赫然写着——
快来认识一下我们全新的视频生成模型。重新混剪你的视频,直接在对话中编辑,尝试模板。
显然,谷歌以全新形式带来了Gemini Omni!
![]()
这可能是一个全模态的Gemini,同时支持文本、图像、音频、视频输入和输出。
与Veo不同的是,Omni将像Nano Banana一样深度集成到Gemini中,具备更出色的提示理解与推理能力。
尤其是,在实时视频编辑上,可以一键物体替换,去除水印。
![]()
与此同时,Omni模型的ID也被同时爆出——
fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200
可见,Omni生成的视频支持10s时长,分辨率1280x720。
![]()
真正让全网陷入疯狂的是,几个提前测试放出的demo。
教授黑板推公式,全网震惊
![]()
最炸裂的那个一,便是开篇「教授在黑板上推导三角恒等式」的视频。
画面中,教授手持粉笔在黑板上一步一步写下数学证明,同时用口语同步讲解当前推导步骤。
![]()
懂行的人看到这会直接跳起来。在AI生成视频里把数学公式写对,这件事有多难?
文本一致性一直是视频生成模型的「阿喀琉斯之踵」。
此前,Sora生成的文字经常是看着像字,但仔细一看全是「鬼画符」的状态,更别提完整的数学推导了。
![]()
而Omni的这段demo,公式是对的,推导是连贯的,笔迹是自然的。
更难以想象的是,这个惊艳的demo,仅用了一句提示词——
A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.
许多人看完,直接破防!
不得不说,AI视频生成已跨越「恐怖谷」,正式进入超写实时代。
![]()
![]()
![]()
还有灰度到的网友,也做了一批类似的视频,个个都好到爆。
真正的杀手锏:实时编辑
![]()
Gemini Omni强大之处不止于生成,这一次,「实时编辑」也实现了大幅跨越。
泄露的演示中,Omni展现了令人瞠目的编辑能力——
一键去水印:Omni可以直接对话去水印,且画面毫无破绽;
物体替换: 动动嘴,视频中的物体就被精准替换,光影、遮挡关系全部自动适配;
![]()
如下demo中,上面是原视频,仅需一句话把意大利面换成「奶油浓汤」,瞬间完成。
再比如,上传一个Sora之前生成的视频,Gemini Omni可以直接去除水印。
![]()
![]()
有人对此表示,仅是去水印这一点,足以让这一工具成为创作者的游戏规则改变者。
![]()
不仅如此,Gemini Omni还可以支持风格化输出。
下面这个动漫风格的视频,蓝色火焰特效、打斗动作线条,每一帧都像是专业动画师手绘的。
不过早期测试显示,Gemini Omni额度消耗非常快。
![]()
谷歌杀回,Sora 2却关停了
Gemini Omni泄露的时间点,堪称「精准卡位」。
就在两周前——4月26日,OpenAI的Sora App正式停服。
这个曾经让全世界为之疯狂的AI视频生成器,走完了它短暂而戏剧化的一生。
![]()
回顾一下Sora的死因,简直是一部商业悲剧:
烧钱速度惊人,据称,Sora的推理成本高达每天100万到1500万美元。视频生成比文本和图像生成贵了不止一个量级,而这个成本始终没降下来。
![]()
最关键的是,OpenAI留不住用户。峰值约100万活跃用户,到停服前已跌破50万,30天留存率不到8%。
整个生命周期的应用内收入仅约210万美元,连一天的算力费都覆盖不了。
3月24日,Sora官方账号在X上发出那句著名的告别,「We're saying goodbye to the Sora app」。
API将在9月24日彻底关闭,一个时代结束了。
![]()
谷歌I/O 2026将在5月19日开幕,Gemini Omni极有可能在主舞台上正式亮相。
AI视频赛道,又要变天了。
有网友将Omni生成的视频,和Sora 2做了一个直观对比,效果简直差出好几个量级。
![]()
![]()
动漫打斗场景中,Gemini Omini丝滑到炸裂,Sora特效却一团乱麻。
![]()
![]()
I/O倒计时,谷歌摊牌
除了Omni,谷歌多款尚未正式发布的Gemini「全线模型」被意外推送到生产环境API中。
此次泄露的模型阵容极其豪华,包括Gemini 3 Flash、3.1全系列(Pro、Flash Image、Lite、TTS),以及专注于高保真音频生成的Lyria 3 Pro。
最重磅的是,谷歌即将推出的「Omni」原生多模态视频模型,将针对所有的核心模型推出专门的Agent版本。
![]()
I/O主舞台,谷歌要摊牌了!
参考资料:
https://x.com/chetaslua/status/2053824398503678108?s=20
https://x.com/testingcatalog/status/2053857806374064496?s=20
https://x.com/Waguri_Kaoruko8/status/2053818116237353039?s=20
https://www.reddit.com/r/singularity/comments/1ta99ss/upcoming_leaked_gemini_omni_vs_nearly_shutting/
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.