![]()
Sora 下线的同时,国内一家做多模态视频生成的公司却在两个月内连续拿了两笔共 26 亿人民币的融资。
今天就分享这家公司:生数科技。
生数科技成立于 2023 年 3 月,核心方向是多模态大模型,当前最核心的产品是视频生成平台Vidu。
![]()
从融资看,这家公司已经进入重投入、重扩张阶段。今年 2 月,生数完成超过 6 亿元人民币 A+ 轮融资;4 月,又完成20 亿元人民币左右的 B 轮融资,由阿里云领投。
生数最核心的技术人物是朱军,是公司的创始人兼首席科学家。
朱军本身是清华大学计算机系教授、清华大学人工智能研究院副院长,长期做机器学习、生成模型和扩散模型方向。
![]()
公司早期创始班底还有唐家渝和鲍凡:唐家渝本硕都在清华计算机系,做过腾讯优图、瑞莱智慧;鲍凡是清华计算机系博士,长期跟着朱军做扩散模型和多模态生成。
2025 年 3 月,原火山引擎 AI 业务负责人骆怡航加入生数出任 CEO,负责研发、产品、商业化和团队管理。
这个团队组合很有代表性。
换句话说,生数不是“高校老师带学生创业”的轻团队,它已经把科研、产品化和商业化三层都拼好了。
尤其是 CEO 骆怡航加入后,外界对它的判断也明显从“技术明星项目”转向“准备大规模商业化的视频模型公司”。
生数不是靠套开源模型起来的。它反复强调的技术底座叫U-ViT。
这个架构最早在 2022 年 9 月由朱军团队提出,是扩散模型和 Transformer 融合的一套自研路线。
2023 年,团队又基于这个架构做了 UniDiffuser。2024 年核心产品 Vidu发布时,外界都把它看作这条技术路线在视频生成上的一次产业化落地。
![]()
它在技术上的打法是:先有模型,再有产品。所以你会看到它既在推 Vidu,也在往“世界模型”方向延展。
生数把自己的技术架构讲成三层:底层是基础世界模型,上面分成数字世界的生成模型和物理世界的行动模型。
这个方向还比较早,但至少说明它的自我定位,不只是做一个创意工具,而是想把视频模型继续往更通用的建模能力上推。
也就是说,它不是单一的视频生成工具,而是一整套内容生产入口。
![]()
再往下拆,Vidu 现在至少有三层产品形态。
第二层是面向开发者和企业的 MaaS / API。
Vidu 的开放平台是给企业和开发者“无缝创建并规模化扩展视频驱动产品”的平台。
它支持视频生成、图像生成、音频生成和其他工作流组件,已经是一套企业可接入的能力层。
第三层是行业合作与解决方案。
官网的合作页列了很多生态伙伴:百度智能云、AWS、华为云、视觉中国等。
其中参考生视频被官网直接称为全球首个参考生视频功能,主打角色、物体、场景的一致性。
先来看参考生视频。
参考生视频是先给模型一张或几张参考图,再让它按这些图里的角色、物体、场景去生成视频。核心价值就是保持一致性和内容创作的连续性。
模型层面,不同版本的产品能力区分得也很清楚:Q2 动态更强、细节更丰富;Q1 画面更清晰、过渡更平滑、运镜更稳定;2.0 的特点是速度快。
接下来是图生视频。
图生视频的逻辑更直接,就是把静态图变成动态视频。
它比较强调镜头运动设计、语义理解和电影感输出。2024 年 Vidu 刚发布时,公开资料就提到它支持一键生成最长 16 秒、1080p 的高清内容,并在多镜头语言、时空一致性、动态表现上去对标 Sora。
Vidu 支持音频和画面同步输出,而且不是只加一个背景音轨,而是对话、旁白、音效、音乐四类音轨可以一次生成;单次最长支持16 秒。
适用场景写得也很清楚:漫剧、漫画风剧情、电影感镜头、短剧、叙事广告。
最后,速度是生数一直在打的点。
官方报道,Vidu 2.0 在图生视频和首尾帧生视频上,生成 4 秒 512P 单片段视频都已做到10 秒以内;单片段视频实测推理速度已经压到30 秒以内。
生数的商业模式其实前面已经说的比较清楚,主要分三块。
Vidu 官网有订阅页和免费积分机制,所有用户可以先拿免费积分体验,再根据需要订阅。
第二块是API 调用收费。
这一块是它最标准的 MaaS 模式。开发者或企业通过开放平台,按模型、分辨率、时长来计费。不同模型和分辨率的价格不同。
第三块是企业项目与行业合作。
生数并不是单纯卖标准 API,它还在做联合解决方案、生态接入和行业项目。
视觉中国和它一起做视觉产业大模型平台,AMD帮它往端侧和 AI PC 部署扩展,百度千帆帮它扩大企业调用场景。
这类合作通常意味着更高客单价和更深绑定。
第一组是早期爆发力。
官网报告,Vidu 从 2024 年 7 月底全球上线后,20 天用户数破百万,100 天破千万,累计生成视频过亿条。
参考生视频这个功能上线 3 个月后,用户用它生成的视频也已经到千万条级别。
第二组是2025 年全年增长。
Vidu 在 2025 年实现了用户和收入都超过 10 倍增长。行业客户包括索尼电影、腾讯动漫、字节跳动等。
第三组是全球覆盖和行业渗透。
生数现在的竞争力,主要有三个。
第一,它的技术栈是自己的。U-ViT 这条路线、UniDiffuser 这类研究积累,让它不是靠套壳起家。这会直接影响模型迭代速度和长期天花板。
同时,这家公司也面对无法回避的现实压力。
一是视频模型赛道迭代太快,阿里、字节、快手、可灵、Runway、Google、xAI 都在卷,模型领先窗口往往很短。
二是它现在很多案例仍然是“官方案例”或“匿名客户案例”,这说明公司已经有商业化,但对外能验证的客户细节还不算特别多。判断它未来的稳固程度,还要继续看更多长期付费客户、续费率和大客户占比。
三是它往世界模型走,想象空间更大,研发和算力投入也会更重。今年以来的连续大额融资本身既说明市场看好,也说明这门生意依然非常烧钱。
以上,祝你今天开心。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.