
作者 | Talk君
大家好,我是talk君
“当动画刚出现时,人们曾激烈反抗……现在AI也正发生极其相似的事情,但技术无法阻挡。”
梦工厂前CEO Jeffrey Katzenberg的这段话,如今在红衫资本最新播客中再次被Fal.ai创始团队引用。
作为OpenAI Sora、Google Veo及可灵等600多个模型背后的算力基建提供商,Fal.ai站在一个独特的位置观察着整个行业变迁。
在他们看来,视频生成领域正经历着极端的速度与残酷——顶级模型的领先优势只能维持短短30天,生成一段5秒视频的算力消耗甚至是处理一次ChatGPT对话的10000倍。
算力黑洞:视频生成的物理极限
大语言模型和视频模型在底层架构上是两个完全不同的物种。LLM(大语言模型)的核心瓶颈是“内存带宽”,如同搬运工的苦恼,预测每一个字都需要在庞大参数库中“搬运”一遍。
视频扩散模型则面临“计算能力”的瓶颈,它需要同时对数万个Token进行复杂的去噪和注意力计算,瞬间榨干GPU的每一个计算单元。
生成一张图片相当于处理100个LLM Token,而生成一个5秒视频相当于生成100张图片。
如果换算下来,生成一段短视频的算力消耗是处理一次文本对话的10000倍以上。若追求4K画质,这个数字还要再翻10倍。 这意味着视频生成是目前所有AI模态中对算力消耗最恐怖的领域,没有之一。
30天生死线:模型竞争的残酷节奏
在这个重工业赛道上,竞争的残酷性以另一种形式呈现。如果说大语言模型领域已逐渐演变为少数巨头盘踞的“帝国之战”,那么视频生成领域,则更像一片“黑暗森林”。
在这里,没有永恒的王者。一个模型可能因为其惊人的物理模拟能力或独特的艺术质感,在社区中引发狂欢,登上排行榜首位。
但它的王座极不稳定。新的挑战者可能在几周后,就从另一个维度实现突破——或许是更精准的人体动力学,或许是更丰富的风格化表现。
Fal.ai观察到的“前五名模型平均霸榜期仅30天”的现象,描绘的正是这种令人窒息的迭代速度。
这形成了视频生成领域独特的“30天生死线”。你的技术优势窗口期短暂得可怕。开发者与创作者是务实而“贪婪”的,他们不为任何单一品牌的“信仰”买单,他们只追随当下最能解决实际问题的工具。
于是,我们看到一个有趣的现象:一个成熟的工作流,往往由十多个各司其职的专门化模型串联而成。从构图、生成、到修复、超分,创作者像乐队指挥,调配着不同的“乐器”(模型)。
这种生态,使得单一模型试图建立垄断的难度大大增加。因为视觉的“好坏”与“风格”有强烈的主观性,开源社区得以蓬勃生长,不断从底部孕育挑战者。
竞争,不再是争夺一个终极的“通用智能”,而是争夺在某个细分需求上、某个特定时间段内的“最佳工具”地位。这是一场没有终点、也无法停歇的极限越野。
好莱坞的反击:从恐慌到掌控
半年前,AI生成视频的早期演示,确实让 好莱坞 引发了一阵真实的焦虑。但焦虑的本质,并非恐惧被取代,而是恐惧在理解新工具的速度上落后。
如今,风向已然转变。那些拥有百年叙事积淀、顶级人才库和庞大知识产权宝库的娱乐巨头,正迅速完成从“恐慌”到“掌控”的心态切换。
它们开始意识到,AI生成技术,更像数字时代给予的又一枚强大的“画笔”或“摄像机”,而不是一个会自主编写剧本、颠覆行业的“天网”。
它的核心价值,在于将那些曾经因成本过高而无法实现的视觉想象(如宏大的奇幻场景、复杂的生物角色)变得触手可及,从而解放而非替代创作者的叙事野心。
杰弗瑞·卡森伯格的洞察在此刻尤为深刻:技术降低了制作“画面”的门槛,但从未降低创作“好故事”的门槛。
情感共鸣、人物弧光、主题深度——这些构成作品灵魂的元素,依然是人类创作者无可替代的领域。AI的到来,可能不会立刻催生出颠覆《教父》的电影,但它一定会催化出一批全新的、在真人电影经济模型下根本不可能存在的视觉内容物种。
教育:生成式视频的第一个主战场
出乎意料的是,生成式视频最先可能彻底改变的领域不是娱乐,而是教育。 教育是一个长期被内容生产成本锁死的行业。
教育的核心问题从来不是“有没有需求”,而是能否以足够低的成本持续生产高质量、适配个体的内容。
今天的大多数教育内容本质上仍是文本和静态图像的组合,不是因为它们最好,而是因为这是目前唯一负担得起的规模化方式。
生成式视频让另一种可能性变得现实:同一个概念可以用不同风格、不同节奏、不同隐喻去呈现。 当“讲解方式”本身变成可生成、可调节的变量,学习将不再是对抗,而是协作。
未来图景:新物种的诞生
Fal.ai团队对未来12个月的预测充满了想象力:一年内,我们将看到完全由AI生成的、长达20分钟且剧情连贯的短片。由于无需拍摄真人,非写实风格将率先爆发。
视觉化教育也将成为可能。未来的维基百科可能不再是文字,而是实时生成的解说视频。更进一步的设想是“一次性游戏”——从“文生视频”进化到“文生游戏”。
用户输入一个想法,AI生成一个玩完即扔的专属小游戏,这将彻底改变互动娱乐的定义。
Fal.ai的70人团队支撑着45亿美元的估值,服务着从Adobe到Shopify的200多万开发者。 但比这些数字更震撼的是他们揭示的行业真相:模型层面的竞争已变得如此激烈,以至于真正的价值正在从模型本身向运行层转移。
在硬件架构出现革命性突破之前,算力瓶颈将死死卡住视频AI大规模普及的咽喉。 而最终留下来的,不是技术最先进的一方,而是最懂得如何与观众建立关系的一方。
你对此有什么看法?欢迎评论区留言讨论~
赶紧关注视频号@一刻talks吧!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.