网易首页 > 网易号 > 正文 申请入驻

并行扩散架构突破极限,5分钟AI视频生成,叫板OpenAI与谷歌?

0
分享至




机器之心报道

机器之心编辑部

近日,一家名为 CraftStory 的 AI 初创公司推出了 Model 2.0 视频生成系统,凭借可生成长达五分钟的富有表现力、可媲美专业水准、以人为中心的视频,破解了困扰 AI 视频生成行业长久以来的「视频时长」难题,引起热议,并被视为或将是 OpenAI 的 Sora 和 Google 的 Veo 的强有力竞争者。



资料显示,CraftStory 由全球使用最广泛的计算机视觉库 OpenCV 的创建者 Victor Erukhimov 创立,他是 OpenCV 的早期贡献者之一,参与了 OpenCV 库的开发和维护。此外,他曾联合创立 Itseez——专注于开发运行于嵌入式平台(特别是汽车安全系统)的计算机视觉解决方案,担任首席技术官、首席执行官和总裁,2016 年 Itseez 被英特尔收购。

CraftStory 此次推出的 Model 2.0 视频生成系统在视频时长上的突破,可能会为那些难以扩大视频制作规模以用于培训、营销和客户教育的企业,带来巨大的商业价值。





大家都知道,包括当前的行业佼佼者 OpenAI 的 Sora 2,所生成的视频时长上限也仅为 25 秒,同类模型生成的视频片段也在这个范围甚至更短,虽然生成的视频画面精美、性能优良,但从市场角度考虑,难以将其广泛应用,尤其是一些电影或长剧集。

据了解,CraftStory 之所以能够破解视频时长难题,突破性进展在于该公司的并行扩散架构,这是一种从根本上不同的 AI 模型生成视频的方法。

传统视频生成模型的工作原理是在越来越大的三维空间中运行扩散算法,其中时间代表第三个轴。为了生成更长的视频,这些模型需要相应更大的网络、更多的训练数据以及更多的计算资源。

而 CraftStory会在整个视频播放过程中同时运行多个较小的扩散算法,并通过双向约束将它们连接起来。

据 Victor Erukhimov 介绍,之所以这样做,是因为「视频的后半部分也会影响前半部分,这一点非常重要,因为如果逐个进行处理,那么出现在前半部分中的瑕疵就会传播到后半部分,然后不断累积。」

比如,对于一个 5 分钟的视频片段,CraftStory 的系统不是生成 8 秒的片段,然后拼接其他片段,而是通过相互关联的扩散过程同时处理所有 5 分钟的片段。

另外,在模型训练数据上,除了从互联网抓取视频外,CraftStory 聘请专业工作室,使用高帧率摄像系统拍摄演员,即使是手指等快速移动的物体也能捕捉到清晰的细节,从而避免了标准 30 帧 / 秒 YouTube 视频中固有的运动模糊,从中获取自有素材去对模型进行训练。因为在 Victor Erukhimov 看来,制作高质量视频并不需要大量数据,也不需要大量培训预算,而是高质量的数据。

Model 2.0 是一个「视频到视频」的转换模型:以图像和行车视频作为输入,并利用行车视频中人物的动作,根据图像生成输出视频。用户可以上传自己的视频,也可以使用 CraftStory 提供的预设视频。该模型经过训练,即使在长达数分钟的视频序列中,也能保留人物的身份、情感和细微差别。

目前,该系统可在大约 15 分钟内生成 30 秒的低分辨率视频片段。先进的唇形同步系统可将嘴部动作与脚本或音轨同步,而手势对齐算法则确保肢体语言与语音节奏和情感基调相匹配。

视频一经发布,引起网友热议,有网友认为,「CraftStory 利用并行传播和专有数据打造的长篇 AI 视频是一项明智之举。它突显了深厚的计算机视觉技术如何能够克服庞大的计算预算限制,满足企业对时长至关重要的、以人为本的持续内容的关键需求。」



也有网友认为,Model 2.0 很好地解决了行业中的「8 秒 AI 视频难题」,「这可能会彻底改变公司处理培训、营销和故事讲述的方式。」另外,CraftStory 的视频帧率更高,「OpenAI是不是要好好反省一下……」





资料显示,本周 CraftStory 刚刚完成一轮 200 万美元的融资,相较于大厂动辄数亿甚至数十亿美元的融资来说,这个数额并不高,但 Victor Erukhimov 似乎并不认同「巨额资金是成功的先决条件」。

他在接受媒体采访时谈道,「我并不完全认同计算能力是通往成功的唯一途径,拥有计算能力当然会有帮助。但如果你仅仅靠一份 PPT 就筹集到十亿美元,最终没有人会满意,无论是创始人还是投资者。」

而不同于大多数视频生成企业聚焦消费者的创意工具这一块,CraftStory 瞄准 ToB 市场,更关注企业,尤其是软件公司该如何制作出色的培训视频、产品视频和发布视频。

据 Victor Erukhimov 透露,CraftStory 的下一个重大发展方向是「文本转视频」模型,该模型将允许用户直接从脚本生成长篇内容。此外,团队还在开发对移动镜头场景的支持,包括在高端广告中常见的「边走边说」格式。

https://venturebeat.com/ai/opencv-founders-launch-ai-video-startup-to-take-on-openai-and-google

https://x.com/craftstoryai/status/1991147573592080652

https://craftstory.com/countdown/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杭州一地发布放假通知:连休10天!浙江各地时间表也排定

杭州一地发布放假通知:连休10天!浙江各地时间表也排定

都市快报橙柿互动
2026-02-27 15:56:56
许家印侄子豪宅4400万元起拍,最终5016万元成交,其投资的广州雅旭公司涉及781件司法案件

许家印侄子豪宅4400万元起拍,最终5016万元成交,其投资的广州雅旭公司涉及781件司法案件

极目新闻
2026-02-26 20:35:24
岳云鹏早期有多“卑微”,一张德云社旧相片,与君把酒话当年!

岳云鹏早期有多“卑微”,一张德云社旧相片,与君把酒话当年!

放开他让wo来
2026-02-25 22:52:19
癌症 “源头” 已发现?油炸食品没上榜,第1名大家或天天都在吃!

癌症 “源头” 已发现?油炸食品没上榜,第1名大家或天天都在吃!

今日养生之道
2026-02-27 20:50:01
美股科技重挫之际,马斯克喊话投资者:请继续持有特斯拉股票 我赌他会价值连城

美股科技重挫之际,马斯克喊话投资者:请继续持有特斯拉股票 我赌他会价值连城

财闻
2026-02-27 15:40:42
五粮液集团董事长相关动向引关注,公司内部人士:不予置评

五粮液集团董事长相关动向引关注,公司内部人士:不予置评

界面新闻
2026-02-27 17:10:10
男篮逆转日本后遭当头一棒?韩国队爆冷输球:中国队别以为稳了?

男篮逆转日本后遭当头一棒?韩国队爆冷输球:中国队别以为稳了?

篮球快餐车
2026-02-27 00:22:31
社保缴费变了!2026年起按新规执行

社保缴费变了!2026年起按新规执行

新浪财经
2026-02-26 21:08:16
华山医院,罚款2500万

华山医院,罚款2500万

医疗器械经销商联盟
2026-02-27 11:58:57
中国互联网最赚钱的一台“印钞机”,突然在一年之内“炸机”

中国互联网最赚钱的一台“印钞机”,突然在一年之内“炸机”

流苏晚晴
2026-02-27 18:16:39
近期,一名中国男子去泰国玩,花6000泰铢找21岁女孩,悲剧发生了

近期,一名中国男子去泰国玩,花6000泰铢找21岁女孩,悲剧发生了

福建平子
2026-02-26 13:52:26
如果江苏去掉了苏锡常,经济水平能排到全国第几呢?

如果江苏去掉了苏锡常,经济水平能排到全国第几呢?

午夜搭车a
2026-02-27 20:03:27
86岁畅销书作家杨本芬就“抄袭”道歉!曾获谷雨文学奖,“出圈”代表作被曝与王朔、余华等人作品高度相似

86岁畅销书作家杨本芬就“抄袭”道歉!曾获谷雨文学奖,“出圈”代表作被曝与王朔、余华等人作品高度相似

都市快报橙柿互动
2026-02-27 11:37:59
FIBA发布声明 为措辞不当向中国男篮及球迷致歉

FIBA发布声明 为措辞不当向中国男篮及球迷致歉

体坛周报
2026-02-27 18:46:17
“太恐怖,iPhone半夜自己给陌生人打47分钟电话!”

“太恐怖,iPhone半夜自己给陌生人打47分钟电话!”

都市快报橙柿互动
2026-02-25 11:28:41
女孩被打后续:村民发声,打人夫妻更多信息被扒,最高可判10年

女孩被打后续:村民发声,打人夫妻更多信息被扒,最高可判10年

天天热点见闻
2026-02-27 07:01:26
特朗普赢了,12架战机刚刚落地,伊朗先举了白旗:禁止发展核武器

特朗普赢了,12架战机刚刚落地,伊朗先举了白旗:禁止发展核武器

铁锤简科
2026-02-27 17:30:48
男子因系统错误“欠款1000万亿元”,远超中国年度GDP总量,征信黑了3年,125万贷款逾期

男子因系统错误“欠款1000万亿元”,远超中国年度GDP总量,征信黑了3年,125万贷款逾期

观威海
2026-02-27 18:23:07
云南景东一小区楼顶加装重达20吨水塔?官方:已责令整改

云南景东一小区楼顶加装重达20吨水塔?官方:已责令整改

澎湃新闻
2026-02-27 15:38:26
巴基斯坦军方称打死274名阿富汗人员

巴基斯坦军方称打死274名阿富汗人员

财联社
2026-02-27 20:04:16
2026-02-28 01:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12374文章数 142572关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

新华社:美国伊朗要打了吗

头条要闻

新华社:美国伊朗要打了吗

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

房产
数码
本地
公开课
军事航空

房产要闻

重磅!海南“十五五”规划出炉!未来五年,方向定了!

数码要闻

Omdia:时隔5年,小米去年再度回归可穿戴设备出货榜首

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国11架F-22隐形战机抵达以色列

无障碍浏览 进入关怀版