大语言模型普遍面临商业模式“撞墙”的焦虑期,AI视频模型已率先跑通了现金流。
2025年第二季度,快手“可灵”营收超2.5亿元,MiniMax的“海螺”2025年前三季度亦创收0.17亿美元。
而在近期,正在冲刺港股IPO的群核科技旗下首个AI视频生成应用LuxReal启动内测,试图在这一吸金赛道中寻找差异化路径。
商业化方面,LuxReal瞄准了具备更强付费意愿的海外电商和短剧的专业用户市场。
技术路径上,则依托群核科技的3D结构化场景数据,提出了一种“拒绝猜像素”的新路径:通过3D建模与视频算法的双重保险,降低抽卡概率,增强空间一致性。
尽管行业正驶向商业化,但“不可控性”使得大多数产品只能停留在“抽卡游戏”阶段,无法满足B端交付中对物理逻辑和细节连贯的严苛标准。
“生成式模型根本不适合制作视频,目前大家看到的能生成视频的AI模型,并不能理解物理世界,它们只是在生成漂亮的图片。”图灵奖得主杨立昆指出。
随着AI视频生成赛道的入局者愈多,行业或许有望探索更多新的技术路径。
远离“猜像素”
Luxreal模型的比较优势,来自群核科技在过去多年间构建的庞大且物理正确的室内空间数据集。
据群核科技现场展示Luxreal生成的DEMO视频中,人物跳舞中并未出现表情崩坏,镜头之间保持了一定的一致性。
目前群核科技已拥有5亿个3D结构化场景和4.4亿商品模型的数据资产,成为了“空间一致性”的保障之一。
当前绝大多数主流AI视频生成模型的核心技术逻辑是采取扩散模型和Transformer的融合来提升一致性。
以OpenAI旗下的视频生成应用Sora为例,其技术路线可以理解为扩散模型与Transformer 的深度融合,既有扩散模型“通过逐步去噪过程从随机噪声生成高质量视频,而非直接预测下一帧像素”的技术优势,还以Transformer的自注意力机制实现对时空维度的全局建模,解决了传统逐帧生成的“记忆衰减”问题。
但空间一致性的实现,要求视频中物体的位置、比例、形状、纹理等可以在镜头移动、视角切换和场景变化中保持物理正确性,这对于当前的绝大部分AI视频生成应用来说普遍存在挑战。
李飞飞认为,人类认知很大程度依赖空间推理,但现有的AI,哪怕是强大的多模态模型在空间理解上仍非常薄弱,例如不理解楚物体大小、位置和距离等。
整体来看,由于训练的数据、算力、算法等方面的局限性,AI视频模型难以理解当前的物理世界运动规律,更多时候是通过“猜测”的形式来完成对下一帧画面的补齐,也就容易出现空间一致性的问题。
Luxreal对此给出的解题思路,是在AI生成视频之前先对主体进行真实的3D建模,试图以此提升视频中物体本身的一致性。
以前述DEMO视频为例,视频中的人物完成了真实的3D建模,这也使得其在运动画面中保持了一致性。
“所以我们相当于在3D层面就对表情做了第一重控制,在视频算法层面再做第二重控制,两层保险叠加能够使得最后的视频效果在动作等方面保持一致性。”群核科技产品经理龙天泽向信风表示。
但若缺乏3D建模环节,Luxreal的空间一致性便要大打折扣。
根据信风参与Luxreal的内测,以一盒乐高搭建的向日葵作为图片和“Lego sunflower model in a cardboard box, showcasing vibrant flowers and green stems, under soft lighting with a warm atmosphere”(乐高向日葵积木模型置于纸盒之中,鲜艳的花盘与翠绿的花茎清晰呈现,柔和光线洒落,营造出温馨惬意的氛围)作为提示词描述,但最终呈现的效果出现了乐高积木悬空、纸盒被替换的问题。
一位Luxreal开发人员向信风表示,该产品仍需要持续优化。![]()
冰火两重天
AI视频生成模型的赛道曾一度不被巨头所看好。
百度创始人李彦宏曾在2024年表示:“Sora这种视频生成的投入周期太长了,10年、20年都可能拿不到业务收益,那么无论多么火爆,百度都不去做。”
但新入局的玩家们确实用实打实的营收数据,打破了巨头们的悲观预期。
今年第二季度,快手旗下的AI视频生成应用可灵已实现超过2.5亿元人民币的营收。
基于这一超预期的商业化表现,快手不仅在2025年三季度财报电话中上调了当年的全年收入预期,还追加了对算力的投入力度。
这同样刺激了快手的股价表现,最近6个月累计涨幅已超过20%。
近期刚上市的MiniMax亦在视频生成应用赛道中崭露头角,其旗下的AI视频生成应用“海螺”在2024年8月上线后迅速成为支柱业务,2025年前三季度创收0.17亿美元(合人民币1.2亿元),占总收入比重高达32.6%。
同期海螺付费用户数达到31万,人均贡献高达56美元,都充分证明用户对于AI视频有着极高的付费意愿。
2026年1月9日,MiniMax上市当天收盘报345港元/股,较发行价上涨109%,市值突破千亿港元。
营收数据的狂飙背后,极低的用户留存率正成为悬在所有玩家头顶的达摩克利斯之剑。
当大众对“让猫跳舞”的新鲜感退潮,绝大多数AI视频生成应用正陷入“拉新容易留存难”的泥潭。
以海螺为例,2025年10月海螺在新加坡苹果用户中的1天、7天、30天、60天用户留存率分别为22.57%、4.62%、0.8%和0.66%。
这意味着,海螺每拉新100个用户,在60天后只有不到1个用户会留在该应用中。
面对C端市场的留存挑战,目前群核科技给出的解法则还是偏向于海外的B端市场。
“目前针对的是海外市场,主要是海外电商、短剧等对视频空间一致性有较高要求的用户。”一位群核科技内部人士告诉信风。
对于电商和短剧制作方等B端用户来说,视频是直接关联转化率的“工具”,其确实具备更强的付费意愿。
但这部分人群对于交付质量同样具有更高的要求,Luxreal能否在充满不确定性的AI视频赛道中,寻找一份属于工具类产品的确定性,仍需经受真实商业环境的持续大考。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.