网易首页 > 网易号 > 正文 申请入驻

即梦、可灵、HappyHorse三强测评,谁翻车了?

0
分享至


AI视频模型进入“三国杀”。

AIX财经(AIXcaijing)原创

作者 | 陈丹

编辑 | 魏佳

随着HappyHorse的正式公测,中国视频生成模型进入“三国杀”时代。

在过去半年里,字节的即梦(Seedance 2.0)、快手的可灵3.0、阿里的HappyHorse先后登顶 Artificial Analysis视频模型榜单第一。

「AIX财经」用六段统一的提示词对三款模型进行了横向测试——四组古典艺术题材、两组现代落地题材。这六组覆盖了AI视频生成关键的能力维度:动作叙事、静态情绪、多人调度、文化符号还原、现代写实质感、商业可用性等。

三家模型在叙事密度、镜头语言、文化辨识度上,给出了三种完全不同的解法,也在不同的环节翻车,如中文文字乱码、多人面孔的“克隆人”现象,以及对特定文化符号的还原失误等。

以下是完整的测试报告。

01.

测试一:赵子龙单骑救幼主

提示词:0-3秒:远景。黄昏战场,烟尘弥漫,残阳如血。一员白袍银甲的年轻将军单骑自远处疾驰而来,白马奔腾,红色披风在身后猎猎飞扬。他怀中紧抱一个襁褓婴儿,一手紧握长枪。

3-6秒:中景。镜头跟随推近,白袍上已溅有斑斑血迹,银甲反射夕阳余晖。他长枪一挑,挑落迎面而来的一名敌将,动作迅猛如梨花纷飞。四周曹军黑甲红旗如潮水般涌动,他穿插其中。

6-10秒:近景特写。将军回首一望,目光坚毅决绝,缰绳一带,白马长嘶人立,他低头看了一眼怀中婴孩,随即扬枪策马,冲入更深的尘烟之中。镜头定格于他冲入尘雾的背影。

整体:中国古典战争电影质感,冷暖对比强烈——白袍银甲与黄沙血色的对比,慢动作与实时动作交错,尘土飞扬,胶片颗粒感,自然光。参考《赤壁》《影》《满城尽带黄金甲》战场镜头美学,4K。

难点:多镜头、多景别、连续叙事;高速动作与慢动作交错;密集群体交互;特定历史风格与画面质感。

战争戏是影视拍摄难度最高的场面之一。模型生成单镜头大片感画面并不难,难的是连续切换景别还能保持叙事连续——马的颜色变了、披风消失、人物面孔在镜头切换间漂移,是这类生成最常见的翻车方式。

这段提示词把难度叠在了一起:景别从远景到近景,节奏实时与慢动作交错,赵子龙、白马等多主体调度,三层挑战同时存在。任何一层失控,画面就垮。


视频:长坂坡赵子龙(即梦版)

Seedance2.0的执行最完整。白马、银甲、红披风、怀抱襁褓、长枪、敌军红旗、夕阳战场这些提示词里的视觉要素几乎全部命中;赵子龙脸颊的伤痕、银甲上的血迹这类细节也按提示词如实生成。最关键的是叙事密度,它在10秒内完成了冲入战场—挑落敌将—回首决绝—冲入尘烟的完整动作弧线,几乎是对提示词的逐句还原。


视频:长坂坡赵子龙(可灵版)

可灵3.0单帧画面质感好,第5秒那一帧,盔甲花纹、披风纹理、群演调度等细节非常充实。但它实际叙事内容只完成了“冲入战场”这一个动作,即梦用4秒讲完的事,可灵用5秒只讲了一半。


视频:长坂坡赵子龙(HappyHorse)

HappyHorse在画面风格上偏离了提示词。提示词要求的是《赤壁》《影》一类的实拍电影质感,HappyHorse给出的却是3D游戏的CG画风,烟尘饱和度过高、写实感偏弱、背景群演面目模糊。在叙事密度上,它最弱。

02.

测试二:黛玉焚稿

提示词:烛光昏暗的卧房内,一名病弱的年轻女子(林黛玉)坐于火盆前,手持诗稿缓缓投入火中。火光映照她苍白消瘦的面容,纸灰随热气飞起。镜头近景固定,极浅景深,光影对比强烈。

难点:静态情绪表演、"哀而不伤"的复杂情绪传达;古典室内空间的光影氛围;火焰与纸张的物理表现。


视频:黛玉焚稿(依次是Seedance2.0、可灵3.0、HappyHorse)

如果说赵子龙考验的是模型的动作能力,那黛玉焚稿考验的就是模型的表演能力。它没有剧烈动作、没有复杂场景,几乎所有信息都靠一张脸表达。这一组的真正难度在于复杂情绪的层次,模型必须在10秒内,通过面部微表情而不是动作来传达人物情感的复杂性。

Seedance2.0的表演水准接近古装剧的演员特写。视频中的黛玉情绪是克制、压抑的哀。后段有一帧人物含泪带笑、似哭非哭,表现出了黛玉“哀而不伤”的复杂感情。

可灵3.0把烛光、火盆、淡青色衣襟、深色木结构组成了一个冷暖对比的工整构图。它处理“焚稿”这个动作时给出了一个比即梦更具叙事铺垫的镜头——先凝视诗稿,再放入火焰,表达黛玉焚稿前的犹豫,但人物表演的层次稍弱。

HappyHorse开场把火焰直接挡在人物面前,后段镜头才切换到人物正面,人物眉头微蹙、眼眶泛红、神情哀痛,比可灵的人物情绪更有带动性,但更像是一种动漫女主式的夸张表达。

03.

测试三:温酒斩华雄

提示词:温酒斩华雄,关羽推帘而入。古代军帐内,众将领围坐于桌前神情凝重。帐外远处传来马蹄声与金鼓声。一员红袍长髯的将军掀开帐帘大步而入,将手中物件掷于桌上。镜头从帐内众人转向帐门,跟随入帐之人转身回到桌前。

难点:多场景跨越叙事(帐内等候-关羽归来);关羽人物形象的精确还原;多人凝视一人的场面调度;暗示性叙事(斩华雄不直接展示)。


视频:温酒斩华雄(依次是Seedance2.0、可灵3.0、HappyHorse)

这段提示词要求模型完成一个真正的电影叙事:两个空间(帐内、帐外)、两个时间(关羽离去、归来)、一组角色关系(凝重的众将VS归来的关羽),要讲一个事件。

主角辨识度也是难点之一。关羽是中国文化里高度符号化的形象,青龙偃月刀、长髯过腹、丹凤眼,任何一项缺失,这个人物就立不住。

这一组,三家模型都翻车了。

Seedance2.0几乎呈现了关羽的所有视觉符号。但视频后半段出现了空间穿模,关羽将手中物件原本搁在桌面靠近自己的一侧,下一帧却跳到了桌面另一侧,身旁众将的视线也随之转向另一边。主体一致性在10秒内出现了断裂。此外,提示词中“温酒”这一关键细节,即梦完全没有表现。

可灵3.0和HappyHorse的关羽辨识度都不足,红袍是有的,但长髯过腹这些关羽的核心视觉符号缺失。“斩首归来”这一核心动作两家也都没有表现。关羽手中之物被理解为酒壶,而不是华雄的首级。动作也变成了“温酒入帐”,叙事的核心反转完全消失。

值得专门指出的是,这一组镜头几乎集中暴露了AI生成多人时的标志性问题:几位将军的面孔高度雷同,同样的胡须、同样的发型、同样的盔甲,这是典型的“克隆人”翻车。

04.

测试四:元妃省亲

提示词:夜晚的中国古典园林,亭台楼阁灯火通明,处处悬挂红色宫灯。香烟缭绕,花影婆娑。仕女们身着华丽古装在长廊中缓步行走。镜头缓慢横移,展现园林全景。柔和暖光,中国古典电影美学。

难点:多元素静态场景调度;复杂建筑空间还原;群体仕女形态一致性;古典园林夜景的光影氛围。


视频:元妃省亲(依次是Seedance2.0、可灵3.0、HappyHorse)

这组测试考验的是模型的东方美学还原能力,它不像战场戏那样靠动作密度赢得视觉刺激,而是靠静态画面里的元素精度。飞檐、雕梁、宫灯、长廊、香烟、水面倒影、人物服装,这些元素中任何一项出错,整个画面就会“塑料化”。

Seedance2.0的画面以人物为主体,叙事感最强。一队仕女缓步行进于水边长廊,服色错落有致,发髻整齐统一。镜头从水面倒影开始,逐步带出建筑、灯笼、再到行进的队列,信息密度层层递进。

可灵3.0的建筑更有质感,池塘雾气和水面倒影更是接近实拍。但开篇近5秒几乎是建筑空镜,人物只在画面边缘晃过;直到后半段镜头切换才出现仕女特写。在这组镜头设计上更重场景,轻人物。

HappyHorse前7秒全是空镜,仰拍灯笼、烟雾、阁楼,镜头在建筑间游移,完全没有人物。到最后2秒才让两位红衣绿裙的仕女缓步入画。虽然后两秒人物的服饰精度、面容质感、回廊光影都可圈可点,但整个视频没有表现出省亲主题。

05.

测试五:早高峰地铁

提示词:早高峰的地铁车厢,镜头缓慢横移扫过几位乘客。有人低头看手机,有人靠窗打盹,有人带着耳机望向窗外。车厢轻微摇晃,窗外隧道灯光快速掠过。

难点:现代城市场景的真实质感;多人物群像;通勤者状态的精准刻画;地铁车厢内部细节。


视频:早高峰地铁(依次是Seedance2.0、可灵3.0、HappyHorse)

这组测试的是纯现代写实场景,任何一处违和,如错误的扶手形制、错位的广告牌、不像中国人的面孔、不真实的拥挤密度,都会让观众出戏。尤其值得指出的是,这组测试具有高度的地域性,北上广深的地铁几乎都有自己的车厢风格,人群的构成、车厢广告等细节很容易出现错位。

Seedance2.0在地域上出现了明显偏移。它的车厢内部精度接近实拍,不锈钢扶手、白色拉环、车门、广告位、座椅蓝色、人物姿态也很自然。但问题在于,画面整体看起来像韩国地铁,广告牌上的疑似韩文、车厢风格、人物面孔都偏韩系。

可灵3.0是三家中地域识别最准确的,车厢风格、宣传海报、广告LED屏、“禁止吸烟”标识等,都是国内地铁的标准配置。可灵的画面同样精度高,人物状态也真实。但它的问题是另一个维度的,车厢太空旷,不像早高峰。

HappyHorse是这一组的意外反超者。它最准确还原了早高峰的拥挤感,密集的站立通勤者、西装上班族在低头刷手机、戴围巾的中年女士、座位上闭眼休息的乘客。

06.

测试六:林黛玉直播带货

提示词:现代直播间内,一位古装少女(林黛玉)坐于精美中式书房布景前,身着月白色绣花襦裙,手持一瓶护肤精华,面带浅笑娓娓而谈。她体态柔弱清瘦,眉间略带忧郁。背景有书架、瓷瓶、绿植,环形补光灯打在她脸上,桌前可见弹幕飘过的屏幕剪影。

难点:古今元素融合的合理性;直播间布景的现代真实感;古典人物气质的精确还原;产品特写的商业可用性;直播表演的微表情。


视频:林黛玉带货(依次是Seedance2.0、可灵3.0、HappyHorse)

这段提示词的难点不在于任何单一元素,而在于合不能让观众笑场,也不能显得违和。

即梦的完成度最高,人物辨识度也最准。清雅气质、忧郁眉眼,黛玉的人物特征被准确捕捉。同时,环形补光灯、苹果笔记本、iPhone取景器、产品礼盒、新中式书房布景也全部到位。人物的口型自然、眼神温和、刺绣细节清晰可见。它让黛玉和直播间在同一个画面里看起来是合理的,而不是滑稽的。

可灵3.0在镜头视角上做了最大胆的设计。它没有正面拍“穿古装的人在直播”,而是给出了一个直播间外的观众视角:前景是一台显示着密密麻麻弹幕的屏幕,后景才是身着古装的少女在直播。这种视角设计还原了直播间这个空间的层次感,没有把它当成一个普通背景。但人物气质偏离了黛玉。

HappyHorse人物镜头出现了严重翻车。主播脸部被一块发光的白色光斑遮挡,可能是模型把环形补光灯的反射误生成在了人物面部上;产品特写镜头中又出现了三只手,这是AI生成手部时最常见的物理翻车之一。

值得注意的是,中文文字生成这个公认的软肋。可灵3.0和HappyHorse模型都给出了带弹幕屏的画面,但所有弹幕文字都是糊的乱码。

07.

结语

这六组测试打下来,三家模型的水平差距明显。

Seedance 2.0是这次测试里综合完成度最高的,核心优势在于叙事密度,能在10秒内把提示词里的动作弧线基本跑完,赵子龙一战几乎是逐句还原,黛玉焚稿也给出了哀而不伤的情绪层次。但它并非没有短板,温酒斩华雄出现了空间穿模。

可灵3.0的单帧质量是三家里最稳的,黛玉焚稿的烛光构图、元妃省亲的水面倒影、地铁场景的标识细节,每一帧单独截出来都经得住放大看。但在连续叙事上仍有所欠缺,有时场景交代充分,人物和事件姗姗来迟。

HappyHorse作为三家里最新公测的模型,它在局部精度与某些场景表现突出,但整体稳定性与风格仍有待探索,例如,在赵子龙测试中给出3D游戏CG风格,元妃省亲前七秒全是空镜。

需要注意的是,不同效果背后,各家的收费也有差异。「AIX财经」同时购买了即梦、HappyHorse最高等级会员、可灵铂金会员,价格分别为499元、188元和186元,生成一段视频三家分别需要330积分、160积分和96积分。

另外,三家模型存在共同没有解决的问题,也代表着当前AI视频生成的天花板。例如,没有一家能在画面里稳定生成可读的中文,多人面孔一致性也是集体翻车点。

总结来看,三家模型都能生成好看的画面,但还没有一家能稳定生成一个完整的故事。AI视频生成要迈向“精准叙事”的专业创作门槛,还需要时间。

声明:内容由AI生成

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普提议中国改买美国石油,外交部:能源政策建议向有关方面了解

特朗普提议中国改买美国石油,外交部:能源政策建议向有关方面了解

澎湃新闻
2026-05-06 17:06:27
大快人心!白洋淀五一彻底凉凉,靠宰客敛财的景区终于迎来了报应

大快人心!白洋淀五一彻底凉凉,靠宰客敛财的景区终于迎来了报应

社会日日鲜
2026-05-05 20:11:56
5种废品价格暴涨,家里有这5样东西的,提醒身边人别乱扔了

5种废品价格暴涨,家里有这5样东西的,提醒身边人别乱扔了

小谈食刻美食
2026-05-06 07:39:22
瀑布秋千亲历者:“没绑紧”不是遇难女孩说的

瀑布秋千亲历者:“没绑紧”不是遇难女孩说的

中国新闻周刊
2026-05-06 22:12:01
DeepSeek预测:未来普通家庭升值最快的5项资产,越早布局越好

DeepSeek预测:未来普通家庭升值最快的5项资产,越早布局越好

洞见
2026-05-06 10:00:15
三星:停止在中国大陆市场销售家电!知情人士回应三星中国业务大调整

三星:停止在中国大陆市场销售家电!知情人士回应三星中国业务大调整

红星新闻
2026-05-06 22:11:21
不与华为合作的车企赢麻了

不与华为合作的车企赢麻了

中车网评
2026-05-06 17:54:28
48小时连收两大利好,日本举国狂欢,中国联合国当众炸锅

48小时连收两大利好,日本举国狂欢,中国联合国当众炸锅

近史博览
2026-05-06 14:42:13
日本航空拿下宇树科技,震惊行业!

日本航空拿下宇树科技,震惊行业!

财经三分钟pro
2026-05-06 15:28:59
谁把女游客推下了悬崖?

谁把女游客推下了悬崖?

宾语观世
2026-05-06 20:10:49
拜仁1-1巴黎圣日耳曼,赛后评分:不是登贝莱第一,拜仁1号排第一

拜仁1-1巴黎圣日耳曼,赛后评分:不是登贝莱第一,拜仁1号排第一

侧身凌空斩
2026-05-07 05:02:33
巴黎6-5淘汰拜仁!第3次进欧冠决赛 跟阿森纳争冠 登贝莱闪击破门

巴黎6-5淘汰拜仁!第3次进欧冠决赛 跟阿森纳争冠 登贝莱闪击破门

侃球熊弟
2026-05-07 04:17:48
5.7世乒赛:德国男团3-0日本,莫雷加德失分,张本克星

5.7世乒赛:德国男团3-0日本,莫雷加德失分,张本克星

小犙拍客在北漂
2026-05-07 03:41:29
光模块爆单已排到2028年!高盛、社保最新加仓4家,市值低至20亿

光模块爆单已排到2028年!高盛、社保最新加仓4家,市值低至20亿

长风价值掘金
2026-05-06 18:06:10
一只青蛙如何被井外势力蛊惑

一只青蛙如何被井外势力蛊惑

黔有虎
2026-05-05 22:54:29
广东94比102输北京,听听各界媒体怎么说?广东输球被赞扬

广东94比102输北京,听听各界媒体怎么说?广东输球被赞扬

南海浪花
2026-05-06 22:28:43
太寒心!盐城龙凤胎事件,孩子早产,老公把彩礼8.8万骤降至3.8万

太寒心!盐城龙凤胎事件,孩子早产,老公把彩礼8.8万骤降至3.8万

魔都姐姐杂谈
2026-05-06 13:19:53
三峡“无缝大坝”缔造者落马!功勋满身,却没管住心中一道缝

三峡“无缝大坝”缔造者落马!功勋满身,却没管住心中一道缝

甜柠聊史
2026-03-25 18:43:05
随着托尼3球+C罗争冠劲敌3-1,沙特联最新积分榜出炉:争冠白热化

随着托尼3球+C罗争冠劲敌3-1,沙特联最新积分榜出炉:争冠白热化

侧身凌空斩
2026-05-07 04:06:21
赖清德回台湾,三个东盟国家为其开放领空

赖清德回台湾,三个东盟国家为其开放领空

混沌录
2026-05-06 22:50:16
2026-05-07 06:04:49
AIX财经 incentive-icons
AIX财经
AI新时代,财经新观察。
47文章数 23217关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

家居
手机
本地
数码
公开课

家居要闻

大胆前卫 时尚大宅

手机要闻

红米Turbo 6 Max硬刚iQOO Neo12,谁才是卷王?

本地新闻

用青花瓷的方式,打开西溪湿地

数码要闻

三星宣布在中国大陆停售家电产品:手机业务不受影响 仍正常销售

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版