网易首页 > 网易号 > 正文 申请入驻

国产视频大模型PixVerse发布运动笔刷,网友:效果超Runway|甲子光年

0
分享至

不卷Demo,卷产品。

作者|赵健‍‍‍

在AI图生视频场景,有一个常见的痛点:仅靠提示词难以达到预期效果,可控性不佳,而且运动方式经常不符合物理规律。

近期,一个名为“Magic Brush运动笔刷”的工具因为很好地解决了该痛点而在AI视频社区走红。

它堪比“神笔马良”,只需寥寥数笔,就能让马斯克对你连连点头:

来自X用户Proper

让哈利·波特挥动魔杖,画圈施法:

来自X用户Proper

让大鱼腾空而起,捕食小鱼:

来自X用户Chase Lean

这款工具来自爱诗科技的PixVerse,在图生视频过程中,用户可通过Magic Brush涂抹区域和绘制轨迹,精确控制视频元素的运动方式,像修图一样修视频。

视频大模型领头羊Runway在2023年11月首次发布了Motion Brush运动笔刷功能,爱诗科技是Runway后首家发布类似功能的AI视频生成公司,且从大量用户实测案例中我们看到,PixVerse的运动笔刷功能要比Runway的灵活性与可控性效果更好,既可以一键智能选区,还能自由绘制运动轨迹

知名AI艺术家达斯汀·好莱坞(Dustin Hollywood)在X上发文表示:“Runway已被PixVerse超越,失去了其领先地位。现在你通过PixVerse的运动笔刷,就能让物体弹跳起来。在当前的AI视频制作中,运动笔刷工具至关重要。”

产品&模型设计师、独立开发者歸藏也表示:“PixVerse发布了自己的运动笔刷功能,产品的可用性上升了一大截。他们甚至可以通过手绘箭头自定义每个元素的运动方向和距离,比 Runway 的滑块更方便和直观。

AI视频生成行业普遍卷Demo、卷生成时长的当下,爱诗科技的PixVerse已经率先朝着AI视频生成的产品实用性方向发力。

1.像修图一样修视频

如果没有亲自上手体验过AI视频生成,可能对于运动笔刷的功能没有直观的感受。但对于用过视频大模型的用户而言,就知道这个功能对于控制视频生成质量有多“香”了。

所以,先看一下Magic Brush运动笔刷的直观效果。(部分取自外网用户发布的实测案例)

  • 多主体的运动控制:分别控制火车与烟的不同运动方向:

  • 桌子上有四个彩球,通过四个箭头的指令来让彩球朝着不同的方向移动。一次最多选定6个目标对象:

  • 即使是同样的运动方向,也可以通过绘制更长的箭头,让左边的汽车移动地更快。

  • 顺应物理规律,视频效果生动自然:火箭发射时,通过上下左右四个箭头,让火箭升空的同时,底部的云彩随着火箭升空而四散开来:

  • 通过箭头的大小来控制水流的不同的流速,瀑布倾泻而下,水流缓缓向前:

  • 基于画面含义理解笔刷,具有故事感:在一个太空场景,通过上下、左右移动箭头,让宇航员随着宇宙飞船的升空而挥手,同时远景处的地球在下降:

  • 更灵活的笔刷指令:在一个晾晒衣服的场景,通过画S形态的箭头,让衣服随风飘荡:


  • 分别控制主体与背景:在宇宙飞船的航行场景,通过刷遍整个背景,让宇宙飞船朝着相反的方向形成更强烈的运动感:

我们能明显看到 PixVerse 运动笔刷的几大优势:

  • 一次最多使用6个笔刷,可以满足复杂运动的创作需求;

  • 笔刷具备AI自动识别能力,帮助用户筛选运动对象;

  • 相比于Runway的运动笔刷只能调整方向,PixVerse可以手绘运动轨迹,灵活性和可控性维度更高。

  • 深度理解物理规律与画面场景,确保视频效果贴近自然效果。

此功能大大提高了视频生成的用户体验和实际效果,能够满足专业创作者在视频制作中的高标准需求。

2.官方解读技术路径

在6月14日智源大会上,爱诗科技CEO王长虎受邀为大模型产业技术论坛做主旨演讲,介绍了PixVerse背后的核心技术。

在2023年爱诗科技成立之初,公司采用过Diffusion+Unet架构的技术路线,这是在Sora出现之前一种主流的文生图、文生视频模型生成路线。这个过程可以想象成将一滴墨水滴入水中,墨水逐渐扩散,而Diffusion模型需要学会如何将墨水从水中重新提取出来。

Unet架构在降低复杂度与保留细节度之间做到了很好的平衡,提升了模型的计算效率,模型的算力需求不会太高。但另一方面,如果要想模型越来越聪明,加入的参数越来越多,图像或指令变得越来越复杂,Unet架构很容易陷入性能瓶颈,面临扩展性问题。

因此,爱诗科技也尝试了Diffusion+Transformer(DiT)架构,通过Scaling Law的方式来提升模型的性能。Sora的出现验证了爱诗的早期判断正确。

不过,爱诗科技并没有止步于此。除了DiT路线之外,也在探索自回归路线在文生视频模型的潜力。自回归路线的代表模型,是谷歌去年12月发布的VideoPoet模型,但没有开源,也没有产品化,只有一篇论文。

王长虎表示:“爱诗科技不会局限在一种技术路线,未来会多种技术路线共同探索,一方面用Transformer路线进一步提升基座模型能力,并加入可控生成技术;另一方面会持续探索自回归路线,增强时空建模,并建立各个模态间统一范式。”

爱诗科技CEO王长虎在智源大会上的演讲,图片由甲子光年现场拍摄

除了最底层的视频生成路线,王长虎还着重分享了视频可控性的核心技术。

首先是角色一致性(C2V,Character to Video)的功能,此前业内一般有两种技术手段——LoRa与Adapter,但两者都不够完美。LoRA的优点在于保真度高,但每个ID都需要重复训练;Adapter的优点是只需要训练一次,成本较低,但生成质量上限没有LoRA高,图片的美学质量偏低。

为了克服这些限制,爱诗科技综合两者的优点,设计了一种基于新的结构,不仅保留了LoRA的优点,还通过添加特定的模块来提升图片的保真度和美学性。

王长虎表示:“无论从主观对比还是客观数据,我们的新结构在多个方面都优于传统的LoRA和Adapter方法。”

爱诗科技CEO王长虎在智源大会上的演讲,图片由甲子光年现场拍摄

第二个技术创新点是运动笔刷。如何控制视频中运动的物体一直是文生视频领域的重点研究方向,但目前业内的方法都较难实现很高的精准度。

比如此前快手、浙江大学、新加坡国立大学联开源的工具DragAnything,通过controlnet+SVD(Stable Video Diffusion)+多条件注入,但是难以实现局部运动控制,同时背景难以稳定。

东京大学与腾讯AILab发布的MOFA-Video使用各种额外的可控信号(例如人体地标landmarks参考、手动轨迹,甚至提供的另一个视频)或它们的组合从给定图像生成视频。但这一模型流程复杂(SVD+controlNet+S2D),也无法对物体进行精准的控制。

针对业内尚未解决得好的问题,爱诗科技提出了一种新的算法:MagicBrush网络结构。

王长虎表示:“一方面在交互层面做了创新,让用户可以更方便地控制画面的运动;第二是模型的架构大大简化,不需要做controlnet注入SVD,只需要做一个预处理+Encoder,再经过一个预先训练好的模型就可以。总结来说就是简洁+高效。”

爱诗科技CEO王长虎在智源大会上的演讲,图片由甲子光年现场拍摄

王长虎认为,未来视频生成领域需要突破的技术重点是更符合物理规律的运动、长时长且精确的视频生成、多镜头场景生成、实时生成、端云协同等。

3.聚焦用户痛点,解决实际需求

最近的文生视频大模型赛道,有点儿“卷”。

在年初OpenAI发布Sora的第二周,「甲子光年」曾梳理了 。近期,海内外又有一波文生视频大模型密集发布,包括快手的可灵视频大模型、极佳科技视界一粟YiSu美图奇想大模型、Luma AI dream-machine大模型等,文生视频的“百模大战”仍在持续。

相比于各种“超越Sora”式的宣传,爱诗科技的Magic Brush运动笔刷功能非常务实,真正解决用户实际创作场景遇到的问题。这正是爱诗科技自己的节奏。

在产品功能的迭代上,爱诗科技优先选择用户需求最大的痛点,而非市场噱头,目标是提供每个人都能使用、且满足真实需求的产品。

4月,PixVerse推出C2V功能,用户能够创作并锁定角色,实现连续、可控的视频生成,避免出现“上一秒是梁朝伟、下一秒是刘德华”的情况。

5月,PixVerse正式上线Magic Brush运动笔刷功能,已在外网掀起试玩热潮。

如此聚焦需求,用户自然就会用脚投票。

目前,根据权威第三方数据网站similarweb统计,爱诗科技的PixVerse与国际头部视频生成产品Runway和Pika的用户规模处于同等量级。除了访问量,PixVerse的访问时长、频次和留存都比Pika好,平均停留时长是Pika的两倍多。同时,国内所有同类型视频生成产品加起来的访问量大约是PixVerse的三分之一。

图片来自similarweb,数据取自文章发布当日

今天,我们应该如何衡量一款视频大模型的好坏?

在半年前,可以是Demo;在三个月前,可以是视频时长;而现在,当很多用户对于AI视频生成尝鲜的新鲜感褪去之后,踏踏实实解决好用户的痛点,回归做产品的本源,才会真正构建长久的竞争力。

(封面图来自Midjourney) ‍

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
还没完了!赵鸿刚对手给所有武林大师下战书,中国武协或出面干预

还没完了!赵鸿刚对手给所有武林大师下战书,中国武协或出面干预

杨华评论
2025-11-05 23:59:12
随着曼城4-1多特,巴萨3-3爆大冷,欧冠最新积分榜:全胜仅剩3队

随着曼城4-1多特,巴萨3-3爆大冷,欧冠最新积分榜:全胜仅剩3队

侃球熊弟
2025-11-06 04:50:26
央视对全红婵的称呼变了,两字之差释放强烈信号,陈宇汐说对了

央视对全红婵的称呼变了,两字之差释放强烈信号,陈宇汐说对了

探源历史
2025-11-06 08:50:00
外星飞船实锤?3iATLAS人造证据频现,或改写人类宇宙史

外星飞船实锤?3iATLAS人造证据频现,或改写人类宇宙史

Science科学说
2025-11-06 08:05:03
舒淇冯德伦同框杀疯了!这才是内娱真夫妻天花板这波狗粮洒的真甜

舒淇冯德伦同框杀疯了!这才是内娱真夫妻天花板这波狗粮洒的真甜

小娱乐悠悠
2025-11-06 07:35:40
60岁大妈坦言:自从雇请年轻男保姆后,我的生活美好了很多

60岁大妈坦言:自从雇请年轻男保姆后,我的生活美好了很多

热心柚子姐姐
2025-11-05 08:31:56
来得真快,安世第二波报复开始,荷兰已切断供应,中方以1挑27国

来得真快,安世第二波报复开始,荷兰已切断供应,中方以1挑27国

匹夫来搞笑
2025-11-05 11:32:28
吃相难看啊!商家们祭出“钢板”吊牌,“白嫖党”依旧招摇过市…

吃相难看啊!商家们祭出“钢板”吊牌,“白嫖党”依旧招摇过市…

火山诗话
2025-11-06 05:54:56
相对论中的“钟慢效应”半个世纪前已经证明,在生活中随处可见!

相对论中的“钟慢效应”半个世纪前已经证明,在生活中随处可见!

宇宙时空
2025-11-05 08:48:22
上海徐汇警方通报“某小区有人被打”:一女子因垃圾堆放问题与邻居产生纠纷,已立案调查

上海徐汇警方通报“某小区有人被打”:一女子因垃圾堆放问题与邻居产生纠纷,已立案调查

极目新闻
2025-11-05 14:33:21
一位姓袁的历史老师,为何能3次准确预言俄乌战争走向?

一位姓袁的历史老师,为何能3次准确预言俄乌战争走向?

猫智深
2025-11-04 20:10:12
蒋万安再次亮明立场,坚持反对两岸统一,郑丽文也让大陆寒心了

蒋万安再次亮明立场,坚持反对两岸统一,郑丽文也让大陆寒心了

顾史
2025-11-05 21:47:44
邵佳一:中国足球正在发展,如果想改变,阵痛肯定是需要的

邵佳一:中国足球正在发展,如果想改变,阵痛肯定是需要的

澎湃新闻
2025-11-05 17:58:31
今年的蒙古国已经乱到没边了,首都乌兰巴托的街头全是抗议的人群

今年的蒙古国已经乱到没边了,首都乌兰巴托的街头全是抗议的人群

南权先生
2025-11-05 16:42:59
11月7号立冬,不论多忙,记得“吃3样,做3样,忌3样”,平安入冬

11月7号立冬,不论多忙,记得“吃3样,做3样,忌3样”,平安入冬

阿龙美食记
2025-11-01 14:23:03
西部独占前五!ESPN更新实力榜:火箭队飙升第5残阵湖人更值得夸

西部独占前五!ESPN更新实力榜:火箭队飙升第5残阵湖人更值得夸

锅子篮球
2025-11-06 10:27:41
在伤人事件中见义勇为,胖东来奖励20名员工,最高5万元

在伤人事件中见义勇为,胖东来奖励20名员工,最高5万元

澎湃新闻
2025-11-06 08:57:04
民进党当局出手封杀淘宝、拼多多,台媒批:不如多花力气清空诈骗

民进党当局出手封杀淘宝、拼多多,台媒批:不如多花力气清空诈骗

海峡导报社
2025-11-05 17:15:43
唯一的主任医师名额给了关系户,我办了离职,结果院长被领导谈话

唯一的主任医师名额给了关系户,我办了离职,结果院长被领导谈话

红豆讲堂
2025-11-04 19:20:03
杨瀚森难兄难弟?曝詹姆斯或被下放发展联盟,詹皇复出开启倒计时

杨瀚森难兄难弟?曝詹姆斯或被下放发展联盟,詹皇复出开启倒计时

二哥聊球
2025-11-06 09:53:59
2025-11-06 10:52:49
甲子光年
甲子光年
中国科技产业化前沿智库
3235文章数 9253关注度
往期回顾 全部

科技要闻

苹果“认输”!曝每年10亿美元租用谷歌AI

头条要闻

美最高法院就关税政策合法性展开辩论 美财长罕见出席

头条要闻

美最高法院就关税政策合法性展开辩论 美财长罕见出席

体育要闻

赢下皇马,会是利物浦的转折点吗?

娱乐要闻

白百何好友揭露争奖细节

财经要闻

特朗普关税遭美国高院大法官轮番质疑

汽车要闻

方向盘?不存在的 特斯拉 Cybercab亚太首秀

态度原创

健康
时尚
教育
数码
军事航空

超声探头会加重受伤情况吗?

中国色特别策划 | 故宫技艺与古意新生

教育要闻

这是大材小用吗?北大毕业生考取并入职辅警

数码要闻

小米通话12月3日停止服务:用户数据将被彻底清除

军事要闻

美国发射洲际弹道导弹 俄方回应

无障碍浏览 进入关怀版