网易首页 > 网易号 > 正文 申请入驻

并行扩散架构突破极限,5分钟AI视频生成,叫板OpenAI与谷歌?

0
分享至




机器之心报道

机器之心编辑部

近日,一家名为 CraftStory 的 AI 初创公司推出了 Model 2.0 视频生成系统,凭借可生成长达五分钟的富有表现力、可媲美专业水准、以人为中心的视频,破解了困扰 AI 视频生成行业长久以来的「视频时长」难题,引起热议,并被视为或将是 OpenAI 的 Sora 和 Google 的 Veo 的强有力竞争者。



资料显示,CraftStory 由全球使用最广泛的计算机视觉库 OpenCV 的创建者 Victor Erukhimov 创立,他是 OpenCV 的早期贡献者之一,参与了 OpenCV 库的开发和维护。此外,他曾联合创立 Itseez——专注于开发运行于嵌入式平台(特别是汽车安全系统)的计算机视觉解决方案,担任首席技术官、首席执行官和总裁,2016 年 Itseez 被英特尔收购。

CraftStory 此次推出的 Model 2.0 视频生成系统在视频时长上的突破,可能会为那些难以扩大视频制作规模以用于培训、营销和客户教育的企业,带来巨大的商业价值。





大家都知道,包括当前的行业佼佼者 OpenAI 的 Sora 2,所生成的视频时长上限也仅为 25 秒,同类模型生成的视频片段也在这个范围甚至更短,虽然生成的视频画面精美、性能优良,但从市场角度考虑,难以将其广泛应用,尤其是一些电影或长剧集。

据了解,CraftStory 之所以能够破解视频时长难题,突破性进展在于该公司的并行扩散架构,这是一种从根本上不同的 AI 模型生成视频的方法。

传统视频生成模型的工作原理是在越来越大的三维空间中运行扩散算法,其中时间代表第三个轴。为了生成更长的视频,这些模型需要相应更大的网络、更多的训练数据以及更多的计算资源。

而 CraftStory会在整个视频播放过程中同时运行多个较小的扩散算法,并通过双向约束将它们连接起来。

据 Victor Erukhimov 介绍,之所以这样做,是因为「视频的后半部分也会影响前半部分,这一点非常重要,因为如果逐个进行处理,那么出现在前半部分中的瑕疵就会传播到后半部分,然后不断累积。」

比如,对于一个 5 分钟的视频片段,CraftStory 的系统不是生成 8 秒的片段,然后拼接其他片段,而是通过相互关联的扩散过程同时处理所有 5 分钟的片段。

另外,在模型训练数据上,除了从互联网抓取视频外,CraftStory 聘请专业工作室,使用高帧率摄像系统拍摄演员,即使是手指等快速移动的物体也能捕捉到清晰的细节,从而避免了标准 30 帧 / 秒 YouTube 视频中固有的运动模糊,从中获取自有素材去对模型进行训练。因为在 Victor Erukhimov 看来,制作高质量视频并不需要大量数据,也不需要大量培训预算,而是高质量的数据。

Model 2.0 是一个「视频到视频」的转换模型:以图像和行车视频作为输入,并利用行车视频中人物的动作,根据图像生成输出视频。用户可以上传自己的视频,也可以使用 CraftStory 提供的预设视频。该模型经过训练,即使在长达数分钟的视频序列中,也能保留人物的身份、情感和细微差别。

目前,该系统可在大约 15 分钟内生成 30 秒的低分辨率视频片段。先进的唇形同步系统可将嘴部动作与脚本或音轨同步,而手势对齐算法则确保肢体语言与语音节奏和情感基调相匹配。

视频一经发布,引起网友热议,有网友认为,「CraftStory 利用并行传播和专有数据打造的长篇 AI 视频是一项明智之举。它突显了深厚的计算机视觉技术如何能够克服庞大的计算预算限制,满足企业对时长至关重要的、以人为本的持续内容的关键需求。」



也有网友认为,Model 2.0 很好地解决了行业中的「8 秒 AI 视频难题」,「这可能会彻底改变公司处理培训、营销和故事讲述的方式。」另外,CraftStory 的视频帧率更高,「OpenAI是不是要好好反省一下……」





资料显示,本周 CraftStory 刚刚完成一轮 200 万美元的融资,相较于大厂动辄数亿甚至数十亿美元的融资来说,这个数额并不高,但 Victor Erukhimov 似乎并不认同「巨额资金是成功的先决条件」。

他在接受媒体采访时谈道,「我并不完全认同计算能力是通往成功的唯一途径,拥有计算能力当然会有帮助。但如果你仅仅靠一份 PPT 就筹集到十亿美元,最终没有人会满意,无论是创始人还是投资者。」

而不同于大多数视频生成企业聚焦消费者的创意工具这一块,CraftStory 瞄准 ToB 市场,更关注企业,尤其是软件公司该如何制作出色的培训视频、产品视频和发布视频。

据 Victor Erukhimov 透露,CraftStory 的下一个重大发展方向是「文本转视频」模型,该模型将允许用户直接从脚本生成长篇内容。此外,团队还在开发对移动镜头场景的支持,包括在高端广告中常见的「边走边说」格式。

https://venturebeat.com/ai/opencv-founders-launch-ai-video-startup-to-take-on-openai-and-google

https://x.com/craftstoryai/status/1991147573592080652

https://craftstory.com/countdown/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为了高市早苗,美国不装了!美军上将明确表态,向台出售防空导弹

为了高市早苗,美国不装了!美军上将明确表态,向台出售防空导弹

松林看世界
2025-11-20 07:00:59
广东全运获惊喜!陈家政四强轰32分!顶投三分+反击能力太狠了!

广东全运获惊喜!陈家政四强轰32分!顶投三分+反击能力太狠了!

篮球资讯达人
2025-11-19 22:16:56
李春来同志突发疾病逝世

李春来同志突发疾病逝世

新京报
2025-11-16 19:20:24
炸裂!郭家形势危急,郭妹哭诉:两人重伤住院,钱从哪来?

炸裂!郭家形势危急,郭妹哭诉:两人重伤住院,钱从哪来?

公子麦少
2025-11-18 14:34:30
42岁胡彦斌恋情曝光,马尔代夫激吻视频流出,女子身份被扒!

42岁胡彦斌恋情曝光,马尔代夫激吻视频流出,女子身份被扒!

花心电影
2025-11-20 08:52:06
甲流来袭,医生提醒:少吃牛奶鸡蛋,多吃5样,免疫力拉满不中招

甲流来袭,医生提醒:少吃牛奶鸡蛋,多吃5样,免疫力拉满不中招

爱生活的陶哥
2025-11-17 10:52:41
相亲女带9个闺蜜来把关,肆意点单超5万,男子:我来吃一碗面就走

相亲女带9个闺蜜来把关,肆意点单超5万,男子:我来吃一碗面就走

多久情感
2025-11-19 15:14:40
即将见证历史?中方5步反击,实施第3步,日本即将服软认错?

即将见证历史?中方5步反击,实施第3步,日本即将服软认错?

时时有聊
2025-11-20 07:39:14
不装了?面对解放军武力夺台,郑丽文语出惊人,喊出“武力保台”

不装了?面对解放军武力夺台,郑丽文语出惊人,喊出“武力保台”

赵钇是个热血青年
2025-11-05 17:29:23
深挖 | 骑摩托、玩摇滚、猜拳赢了让老公跟自己姓……高市早苗,要多野有多野!

深挖 | 骑摩托、玩摇滚、猜拳赢了让老公跟自己姓……高市早苗,要多野有多野!

新民周刊
2025-11-18 13:07:03
C罗参加特朗普晚宴,大赞特朗普改变世界,与众多大佬谈笑风生

C罗参加特朗普晚宴,大赞特朗普改变世界,与众多大佬谈笑风生

小金体坛大视野
2025-11-20 09:19:46
刘强东私人酒单曝光!称招待老友用五粮液,背后是百亿级生意

刘强东私人酒单曝光!称招待老友用五粮液,背后是百亿级生意

南方都市报
2025-11-20 20:58:02
黑龙江省军区政委马春娃,上任不久就揪出“军中老虎”,后来呢

黑龙江省军区政委马春娃,上任不久就揪出“军中老虎”,后来呢

元哥说历史
2025-11-20 16:10:03
普京宣布赴俄免签近期生效!国内一旅行社称特别多计划去北海道的游客转去俄罗斯:价格差不多,还能看极光或蓝冰

普京宣布赴俄免签近期生效!国内一旅行社称特别多计划去北海道的游客转去俄罗斯:价格差不多,还能看极光或蓝冰

极目新闻
2025-11-20 17:52:05
邓亚萍祝贺王曼昱被饭圈冲击:你不应该感恩我莎么,要不谁认识你

邓亚萍祝贺王曼昱被饭圈冲击:你不应该感恩我莎么,要不谁认识你

一只番茄鱼
2025-11-17 21:37:05
日本民宿被曝变身卖淫场,性工作者称中国游客更大方。

日本民宿被曝变身卖淫场,性工作者称中国游客更大方。

环球趣闻分享
2025-11-09 14:20:06
男子花14.8万,迎娶假“高官之女”

男子花14.8万,迎娶假“高官之女”

中国新闻周刊
2025-11-20 21:42:18
北漂的春天!北京落户大放宽,孩子上学、买房终于有戏了

北漂的春天!北京落户大放宽,孩子上学、买房终于有戏了

墨印斋
2025-11-19 12:19:54
中英香港谈判中方为何吃暗亏?因我方出内鬼,6年后中央布局抓捕

中英香港谈判中方为何吃暗亏?因我方出内鬼,6年后中央布局抓捕

阿胡
2024-10-11 16:54:21
英国公布圆明园被毁前的照片,美如仙境,引起世界关注!

英国公布圆明园被毁前的照片,美如仙境,引起世界关注!

兴趣知识
2025-09-27 20:29:02
2025-11-20 22:24:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11764文章数 142508关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

摄影师拍的照片被视觉中国告侵权还收到威胁 法院判了

头条要闻

摄影师拍的照片被视觉中国告侵权还收到威胁 法院判了

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

揭秘三体公司原CEO许垚投毒杀人案始末

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

教育
艺术
亲子
旅游
手机

教育要闻

期末必考!中考常考!九上物理电功率必考题型,初学者几乎全错

艺术要闻

陈洪绶:花鸟册二十开

亲子要闻

重庆知名幼儿园爆雷后:负责人已被批捕,接收方收餐费遭反对

旅游要闻

上观时评 丨秋假撞上免门票,“人挤人”有招吗

手机要闻

2025年9月国内市场手机出货量2793.1万部,同比增长10.1%

无障碍浏览 进入关怀版