网易首页 > 网易号 > 正文 申请入驻

并行扩散架构突破极限,5分钟AI视频生成,叫板OpenAI与谷歌?

0
分享至




机器之心报道

机器之心编辑部

近日,一家名为 CraftStory 的 AI 初创公司推出了 Model 2.0 视频生成系统,凭借可生成长达五分钟的富有表现力、可媲美专业水准、以人为中心的视频,破解了困扰 AI 视频生成行业长久以来的「视频时长」难题,引起热议,并被视为或将是 OpenAI 的 Sora 和 Google 的 Veo 的强有力竞争者。



资料显示,CraftStory 由全球使用最广泛的计算机视觉库 OpenCV 的创建者 Victor Erukhimov 创立,他是 OpenCV 的早期贡献者之一,参与了 OpenCV 库的开发和维护。此外,他曾联合创立 Itseez——专注于开发运行于嵌入式平台(特别是汽车安全系统)的计算机视觉解决方案,担任首席技术官、首席执行官和总裁,2016 年 Itseez 被英特尔收购。

CraftStory 此次推出的 Model 2.0 视频生成系统在视频时长上的突破,可能会为那些难以扩大视频制作规模以用于培训、营销和客户教育的企业,带来巨大的商业价值。





大家都知道,包括当前的行业佼佼者 OpenAI 的 Sora 2,所生成的视频时长上限也仅为 25 秒,同类模型生成的视频片段也在这个范围甚至更短,虽然生成的视频画面精美、性能优良,但从市场角度考虑,难以将其广泛应用,尤其是一些电影或长剧集。

据了解,CraftStory 之所以能够破解视频时长难题,突破性进展在于该公司的并行扩散架构,这是一种从根本上不同的 AI 模型生成视频的方法。

传统视频生成模型的工作原理是在越来越大的三维空间中运行扩散算法,其中时间代表第三个轴。为了生成更长的视频,这些模型需要相应更大的网络、更多的训练数据以及更多的计算资源。

而 CraftStory会在整个视频播放过程中同时运行多个较小的扩散算法,并通过双向约束将它们连接起来。

据 Victor Erukhimov 介绍,之所以这样做,是因为「视频的后半部分也会影响前半部分,这一点非常重要,因为如果逐个进行处理,那么出现在前半部分中的瑕疵就会传播到后半部分,然后不断累积。」

比如,对于一个 5 分钟的视频片段,CraftStory 的系统不是生成 8 秒的片段,然后拼接其他片段,而是通过相互关联的扩散过程同时处理所有 5 分钟的片段。

另外,在模型训练数据上,除了从互联网抓取视频外,CraftStory 聘请专业工作室,使用高帧率摄像系统拍摄演员,即使是手指等快速移动的物体也能捕捉到清晰的细节,从而避免了标准 30 帧 / 秒 YouTube 视频中固有的运动模糊,从中获取自有素材去对模型进行训练。因为在 Victor Erukhimov 看来,制作高质量视频并不需要大量数据,也不需要大量培训预算,而是高质量的数据。

Model 2.0 是一个「视频到视频」的转换模型:以图像和行车视频作为输入,并利用行车视频中人物的动作,根据图像生成输出视频。用户可以上传自己的视频,也可以使用 CraftStory 提供的预设视频。该模型经过训练,即使在长达数分钟的视频序列中,也能保留人物的身份、情感和细微差别。

目前,该系统可在大约 15 分钟内生成 30 秒的低分辨率视频片段。先进的唇形同步系统可将嘴部动作与脚本或音轨同步,而手势对齐算法则确保肢体语言与语音节奏和情感基调相匹配。

视频一经发布,引起网友热议,有网友认为,「CraftStory 利用并行传播和专有数据打造的长篇 AI 视频是一项明智之举。它突显了深厚的计算机视觉技术如何能够克服庞大的计算预算限制,满足企业对时长至关重要的、以人为本的持续内容的关键需求。」



也有网友认为,Model 2.0 很好地解决了行业中的「8 秒 AI 视频难题」,「这可能会彻底改变公司处理培训、营销和故事讲述的方式。」另外,CraftStory 的视频帧率更高,「OpenAI是不是要好好反省一下……」





资料显示,本周 CraftStory 刚刚完成一轮 200 万美元的融资,相较于大厂动辄数亿甚至数十亿美元的融资来说,这个数额并不高,但 Victor Erukhimov 似乎并不认同「巨额资金是成功的先决条件」。

他在接受媒体采访时谈道,「我并不完全认同计算能力是通往成功的唯一途径,拥有计算能力当然会有帮助。但如果你仅仅靠一份 PPT 就筹集到十亿美元,最终没有人会满意,无论是创始人还是投资者。」

而不同于大多数视频生成企业聚焦消费者的创意工具这一块,CraftStory 瞄准 ToB 市场,更关注企业,尤其是软件公司该如何制作出色的培训视频、产品视频和发布视频。

据 Victor Erukhimov 透露,CraftStory 的下一个重大发展方向是「文本转视频」模型,该模型将允许用户直接从脚本生成长篇内容。此外,团队还在开发对移动镜头场景的支持,包括在高端广告中常见的「边走边说」格式。

https://venturebeat.com/ai/opencv-founders-launch-ai-video-startup-to-take-on-openai-and-google

https://x.com/craftstoryai/status/1991147573592080652

https://craftstory.com/countdown/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
净身出户?62岁的张近东押上个人所有财产救苏宁

净身出户?62岁的张近东押上个人所有财产救苏宁

帅真商业
2025-11-19 19:43:38
日本笑了!中国制造在东南亚自杀!占有率80%狂跌至1%,丢失人心

日本笑了!中国制造在东南亚自杀!占有率80%狂跌至1%,丢失人心

芳芳历史烩
2025-11-19 20:39:37
宋朝之前连棉被都没有,零下几十度的寒冬,古人是怎么熬过去的?

宋朝之前连棉被都没有,零下几十度的寒冬,古人是怎么熬过去的?

法老不说教
2025-11-03 19:36:43
段奕宏说得没错,不拍戏就消失的廖凡,早已在另一个圈子红得发紫

段奕宏说得没错,不拍戏就消失的廖凡,早已在另一个圈子红得发紫

伴史缘
2025-11-04 18:04:39
中央组织部决定:刘巍履新

中央组织部决定:刘巍履新

鲁中晨报
2025-11-20 10:42:04
王励勤颁奖沉默!陈梦大赢家,孙颖莎0冠,球迷却意外提到王楚钦

王励勤颁奖沉默!陈梦大赢家,孙颖莎0冠,球迷却意外提到王楚钦

大秦壁虎白话体育
2025-11-19 23:05:04
开拓者1分遭绝杀!可怕的不是杨瀚森得2分,而是连轮换出场达不到

开拓者1分遭绝杀!可怕的不是杨瀚森得2分,而是连轮换出场达不到

侃球熊弟
2025-11-20 13:12:09
甲流来袭,医生提醒:少吃牛奶鸡蛋,多吃5样,免疫力拉满不中招

甲流来袭,医生提醒:少吃牛奶鸡蛋,多吃5样,免疫力拉满不中招

爱生活的陶哥
2025-11-17 10:52:41
6亿成本拖了8年,《美人鱼2》烂尾,华谊连亏5年,周星驰也很无奈

6亿成本拖了8年,《美人鱼2》烂尾,华谊连亏5年,周星驰也很无奈

电影票房预告片
2025-11-19 23:17:51
解放军当年为何不把佩洛西专机干掉?答案其实非常清楚

解放军当年为何不把佩洛西专机干掉?答案其实非常清楚

文史旺旺旺
2025-11-19 21:25:07
挖出戴手铐的女遗骨,鉴定后确定,她就是中央苦苦寻找的人!

挖出戴手铐的女遗骨,鉴定后确定,她就是中央苦苦寻找的人!

老呶侃史
2025-11-16 18:45:42
网约车司机开车“视频聊天”撞死骑行者,法院:犯交通肇事罪

网约车司机开车“视频聊天”撞死骑行者,法院:犯交通肇事罪

南方都市报
2025-11-20 17:14:27
54岁杨钰莹近况曝光:定居深圳,每天打理菜园子,生活平淡

54岁杨钰莹近况曝光:定居深圳,每天打理菜园子,生活平淡

小徐讲八卦
2025-11-17 07:29:28
当年陈官庄66天激战,唯独1个兵团司令活着逃出,21天后在青岛现身

当年陈官庄66天激战,唯独1个兵团司令活着逃出,21天后在青岛现身

宅家伍菇凉
2025-11-05 16:40:02
上位靠睡、赶走原配!刚拿金鸡奖影后的宋佳,私生活传闻有多离谱

上位靠睡、赶走原配!刚拿金鸡奖影后的宋佳,私生活传闻有多离谱

萧鑟科普解说
2025-11-18 10:02:39
朝鲜代表联大发言炮轰日本:日本没有资格和理由觊觎安理会常任理事国席位;此前高市早苗在日本侵略战争、参拜靖国神社等问题上屡触碰红线

朝鲜代表联大发言炮轰日本:日本没有资格和理由觊觎安理会常任理事国席位;此前高市早苗在日本侵略战争、参拜靖国神社等问题上屡触碰红线

极目新闻
2025-11-19 13:18:23
男子4x400米接力:四川队3分04秒81夺冠,江苏第二名

男子4x400米接力:四川队3分04秒81夺冠,江苏第二名

懂球帝
2025-11-20 21:10:11
美女美图7139期

美女美图7139期

手工制作阿歼
2025-11-14 08:13:28
为什么大厂程序员老婆很多都是全职主妇?网友掀桌式回答:真相了

为什么大厂程序员老婆很多都是全职主妇?网友掀桌式回答:真相了

一桶浆糊要一统江湖
2025-11-14 13:15:02
武汉女足2-0!亚冠2轮不败登顶 王霜双响 外援中柱+3次错失必进球

武汉女足2-0!亚冠2轮不败登顶 王霜双响 外援中柱+3次错失必进球

我爱英超
2025-11-20 16:58:37
2025-11-20 22:27:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11764文章数 142508关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

摄影师拍的照片被视觉中国告侵权还收到威胁 法院判了

头条要闻

摄影师拍的照片被视觉中国告侵权还收到威胁 法院判了

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

揭秘三体公司原CEO许垚投毒杀人案始末

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

游戏
艺术
房产
教育
军事航空

《四海兄弟:故乡》推出“自由模式”免费更新

艺术要闻

陈洪绶:花鸟册二十开

房产要闻

超95亿!三亚巨量资产,突然甩出!

教育要闻

期末必考!中考常考!九上物理电功率必考题型,初学者几乎全错

军事要闻

日本称已向美国出口爱国者导弹

无障碍浏览 进入关怀版