网易首页 > 网易号 > 正文 申请入驻

AI视频从此有了影帝级表演?我们深度实测了这两天很火的Gaga AI

0
分享至


作者 | Kino

编辑 | 石濑

Sora 2后,AI视频赛道又杀出一匹新黑马——Gaga AI

见证AI“影帝/影后”诞生的时刻到了。

就在昨天,Gaga AI正式发布了全球首个专注于“人物对话”的影视级音画同出模型GAGA-1,无需邀请码即可注册限时免费体验(https://gaga.art)。

只需要一张人物图片和一段台词指令,它就能生成一段口型精准同步、表情细腻丰富、声音生动真实的视频,甚至能处理双人同框对话的复杂场景,“演技”十分在线。

下面是我用Gaga AI生成的Sam Altman穿越到中国古代当皇帝的视频,很符合人设的一集:

提示词:男人用低沉、威严的声音说:“传朕旨意,给朕打造一个通用宫廷智能。”眼神中带着对终极技术梦想的狂热和执着。

在AI视频领域,除了少数几家巨头,Gaga AI背后的团队Sand.ai可能并不为大众所熟知。但这支极其低调的全华班初创团队,却低成本打造出了全球顶尖的“人物表演”视频模型。他们还曾在业内开源全球首个高质量自回归架构视频模型,堪称AI视频领域的“DeepSeek”

带着对这支黑马团队的好奇,我们第一时间上手体验了GAGA-1模型,一起来看看Gaga AI演员的“演技”如何。


GagaAI演员“试镜”,演技吊打真人

进入Gaga AI官网(https://gaga.art),会发现页面设计很直观,核心功能一目了然。其中,Gaga Avatar是此前的旧功能,而我们本次评测的主角,正是最新上线的Gaga 1


你可以上传本地图片,拍照,也可以直接用AI生成角色形象。然后用自然语言描述角色的情绪、动作和表情,需要特别注意的是,角色的台词必须用引号括起来

根据台词的长度、语速、停顿等,可以选择5秒或10秒的视频时长。目前模型只支持16:9的画幅比例,如果上传的图片尺寸不符,需要进行裁剪。据官方透露,后期会开放9:16的竖屏画幅。

熟悉了基本操作,接下来,好戏开场。

AI真的懂“演技”吗?遵循明确的提示词指令做出喜怒哀乐或许不难,但它能演出那些只可意会、不可言传的潜台词和弦外之音吗?

于是我举办了一场特别的“试镜”。在这场评测中,我担任“导演”,负责提供剧本(也就是Prompt);而出镜的,则是AI演员GAGA-1。我们为它准备了几场风格迥异的戏,话不多说,让我们直接进入片场。

第一场戏是一段典型的中国古装剧独白,看GAGA-1能不能演出东方语境下那种含蓄、克制但暗流涌动的复杂情感。灯光、摄影就位,Action!(以下视频所用的图片未说明是真人的,均为AI生成)

提示词:女人眼神低垂,像是在自言自语,语速缓慢,声音低沉,带着一种看透世事的沧桑说:“这宫墙之内,哪有无辜之人?不过是…看谁的棋子,能活到最后罢了。”然后慢慢抬眼,最后目光坚定而冷冽地看向前方。

这场戏模型对提示词的遵循度极高,精准复现了从眼眸低垂,到慢慢抬眼、目光冷冽的全过程。人物口型与声音的同步无可挑剔,更值得称道的是其声音表现力,语调平缓中带着一丝疲惫和决绝,情感传递非常到位。

说到后半句“看谁的棋子”时,她慢慢抬起头,眼神和语气瞬间变了,一个外表端庄柔弱,实则有心计、有野心的深宫女性形象一下就出来了,本《甄嬛传》十级学者看得甚至有点意犹未尽……

提示词:男人眼神中充满了哀求,声音沙哑脆弱,他恳求地说"Don't say no. I'm begging you... at least not today. Just leave me with a little hope. Please?"


这是一场典型的情感戏,很考验模型对情绪的驾驭能力。可以看出,GAGA-1对人物面部表情的细节处理得很好,特别是眼神。男主全程眉头紧锁,嘴唇微张,眼神里的那种恳求和卑微都表现出来了,让人一下就能入戏,口型和台词的匹配度也很高。

提示词:女人眼神飘忽涣散,用一种低沉、疲惫、略带沙哑的声线说出"It's funny, isn't it? They say everything will pass. But they never mention... what it leaves behind."(挺讽刺的,不是吗?人们总说一切都会过去。可从没人提过...它会留下什么。)在说到"funny"时,她的嘴角浮现一抹充满讽刺的微笑,紧接着表情变成悲伤。

视频里的女人一开始表情很平静,带点忧伤,然后是自嘲的苦笑,最后又演变成悲伤。整个情绪的起伏和控制都处理得很到位,和整体的光影效果和氛围感相得益彰。

匹配的声音也很有特点,是一种磁性、有故事感的声线,和人物的气质很搭。而且,即使在这种光线很暗、细节不好捕捉的环境下,她说话的口型依然非常清晰、同步,这点是很难得的

为了考验GAGA-1的多语言支持能力,我们又用它生成了一段法语戏。视频中的“姐姐”声音很轻,听起来就像是姐妹之间的低声絮语,和她脸上那种专注又担忧的表情也很搭。最关键的是,法语发音和口型的匹配度同样很高。

提示词:姐姐用手肘支撑着身体,正低头凝视着她的妹妹,眼神复杂、忧虑而又紧张地说"C'est ce silence qui m'effraie. Les histoires que tu racontes... sans jamais dire un mot."(让我害怕的,正是这份安静。是你在沉默中所讲述的那些故事。)妹妹则安详地仰卧着。

在处理情绪激动的戏剧化表演,比如悲伤的哭戏时,GAGA-1的完成度同样很高,表现得相当有感染力

提示词:手捧咖啡杯的女人泪水在眼眶里打转,声音因哽咽而颤抖,她说"I gave him everything... and in the end, it wasn't enough."(我倾尽所有……到头来,还是不够。)说完捧起咖啡杯抿了一口。右边的女人安静倾听,缓慢低头,眼神里充满怜爱。

哭泣的女主角连声音都是带着哭腔的,还有抽泣、颤抖、话语间的停顿都很真实,完全就是情绪失控时会有的样子。旁边朋友的角色也处理得很好,她虽然没有说话,但心疼的眼神,和不忍直视低下头的动作,也都给到位了。

下面这个视频是我让童年时期的演员Jodie Foster,说出了一段她成年后在一次采访中的回答,目的是为了模拟一个很有思想的“小大人”在接受访谈,难度在于要表现出一种超越年龄的智慧和古灵精怪的感觉。

提示词:画面中的小女孩面带欣赏和向往的微笑,眼中闪烁着古灵精怪的亮光。她语速流利、声音稚嫩地说"The greatest quality for a woman actually would be um... A kind of intelligence, and um... strength that comes out. Sometimes it's a sort of loony, you know."(女性最可贵的品质,其实是智慧,还有……内在的力量。有时候,是一种疯狂。)

从结果看,GAGA-1完成得很好。小女孩说话的节奏和眼神,“um…”这样的口头禅和自然的思考停顿,听起来很像是在边想边说,有感而发。表情也很生动,活脱脱一个古灵精怪、早熟、有主见的小女孩形象。口型同步方面,模型的表现依然很稳定。

GAGA-1的能力不只局限于真人照片,在处理非写实、平面艺术类素材时也很能打。

提示词:画中的女人神秘、温柔地说"For centuries, they've been wondering what I'm laughing at. Maybe, I just saw you."(几百年来,他们一直在猜我到底在笑什么。也许,我只是看到了你。)

GAGA-1在保持原作质感和美感的基础上,缓缓推进镜头,让画中的蒙娜丽莎“开口说话”,让我瞬间联想到《哈利波特》里那些会动的魔法肖像…… 声音的选择也很加分,这个声线听起来神秘又有智慧,很符合我对蒙娜丽莎的想象,口型和声音的匹配也很自然。

至此,通过一系列严苛的“试镜”,GAGA-1这位“AI演员”无疑已经证明了它的业务能力。在绝大多数场景中,它都兑现了其“影视级”演绎的承诺,生成的视频表现出的情感细腻度远超我的预期

模型能够根据台词的潜在情绪,自主匹配出微妙的眼神变化、合乎时机的停顿,甚至不易察觉的微表情。

在胸部以上的写实风格、近景对话视频中,GAGA-1的表现堪称无懈可击。但对于全身性的动作生成、复杂的镜头移动,以及二次元、拟人化动物等非写实风格,稳定性和效果略逊一筹。

同样,GAGA-1已能稳定驾驭双人互动,但当场景中需要容纳更多人物时,生成的成功率便会有所下降。此外,模型在处理吃饭、抽烟等非对话类的口部动作时,效果还无法与对话时相提并论。

我们还发现,在处理较长的中文台词时,GAGA-1偶尔会出现发音不准、含混不清的情况。而对于较长的英文台词,GAGA-1的表现则一直很稳定。

但终归是瑕不掩瑜,GAGA-1在当下所展现出的能力,已经完成了从让图片开口说话,到为角色注入灵魂的关键一跃。它不再是一个单纯的AI视频工具,更像一个听得懂指令的“AI演员”。对于影视行业和视频内容创作者而言,这意味着效率的指数级提升。


不止是“演员”,更是下一代内容引擎

我们几乎可以断定,Gaga AI的潜力将渗透到影视、广告、游戏等领域,甚至成为搅动整个视频内容创作生态的“鲶鱼”。

影视制作是一个庞大而复杂的工业体系,但现在,一个有好剧本、好创意的创作者,就能以极低的成本,独立完成最核心的人物表演环节。“人人都能成为电影导演”已经不再是一句口号,而是一个我们正在亲眼见证的未来。

除了技术上的惊艳表现,Gaga AI的商业化策略同样显示出了其抢占市场的思路。目前,Gaga Actor限时免费开放给所有用户,据我们了解到的信息,即便未来开始收费后,Gaga AI也会比Veo 3和Sora 2目前的定价低一个量级

目前Gaga AI官网显示的定价方案,是针对其旧功能Gaga Avatar的,订阅制共分为以下四个阶梯,也可以直接购买积分,1美元100积分起购。


当一个专业级的表演生成工具,以一种亲民、普惠的商业化策略进入市场时,其竞争力是毋庸置疑的。Gaga AI有潜力在短时间内,迅速成为AI视频内容创作领域一个不可忽视的生产力平台

不过,在通往规模化的道路上,Gaga AI仍需解决全身动作、多人场景等技术挑战。但无论如何,潘多拉的魔盒已经打开,一个AI深度参与表演的全新内容时代,正在拉开序幕。

看到这里,相信已经有不少玩家跃跃欲试了。

最后再附上Gaga AI产品地址(https://gaga.art),无需邀请码即可注册,我们文中深度体验的Gaga 1,正处在限时免费体验阶段,感兴趣的玩家不妨亲自上手,体验一下当AI“导演”的快乐。

「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。

欢迎分享、点赞、推荐

一起研究AI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄金税收优惠没了,老铺黄金等珠宝商为何重挫?

黄金税收优惠没了,老铺黄金等珠宝商为何重挫?

华尔街见闻官方
2025-11-03 15:49:49
马龙为何不打男单?方博:他接受不了不是世界第一,第二也不行

马龙为何不打男单?方博:他接受不了不是世界第一,第二也不行

念洲
2025-11-03 10:26:45
36F女生穿吊带坐车开山路太颠咋办?晒动图求助后跳绳这个图更狠哈哈

36F女生穿吊带坐车开山路太颠咋办?晒动图求助后跳绳这个图更狠哈哈

王根基
2025-10-31 22:08:10
秦始皇后裔终现身!这 4 个姓氏全是他的血脉,看看有你的吗?

秦始皇后裔终现身!这 4 个姓氏全是他的血脉,看看有你的吗?

猫眼观史
2025-10-27 22:56:06
固态电池被吹成“电池革命”?3大致命缺点,5年内难普及

固态电池被吹成“电池革命”?3大致命缺点,5年内难普及

沙雕小琳琳
2025-11-02 15:01:30
三个央企新能源品牌,销量加起来不如一个新势力

三个央企新能源品牌,销量加起来不如一个新势力

第一财经资讯
2025-11-01 19:26:28
上头有人!柬埔寨诈骗集团头脑陈志,被曝出更多内幕

上头有人!柬埔寨诈骗集团头脑陈志,被曝出更多内幕

王二哥老搞笑
2025-10-21 08:28:28
你见过的土豪是什么样子的?网友:前台小姐直接跟着他走了

你见过的土豪是什么样子的?网友:前台小姐直接跟着他走了

特约前排观众
2025-08-19 00:20:03
独生女家庭醒醒吧,大部分的女婿成不了岳父母的半个儿子,主要有2个原因

独生女家庭醒醒吧,大部分的女婿成不了岳父母的半个儿子,主要有2个原因

有故事的人
2025-10-27 06:35:23
忠告全天下子女:再孝顺,也不要为年过70的老父老母,做这4件事

忠告全天下子女:再孝顺,也不要为年过70的老父老母,做这4件事

小小包工头阿汾
2025-11-03 08:01:59
黄仁勋再喊话特朗普:中国不要我们芯片了,得让他们继续依赖啊

黄仁勋再喊话特朗普:中国不要我们芯片了,得让他们继续依赖啊

boss外传
2025-11-02 19:05:03
曝曼联验货成功欲7000万签新中场!阿莫林冬窗就想买,一人最现实

曝曼联验货成功欲7000万签新中场!阿莫林冬窗就想买,一人最现实

罗米的曼联博客
2025-11-03 07:06:44
撩已婚女人,她若有4种反应,就是在告诉你:可以干

撩已婚女人,她若有4种反应,就是在告诉你:可以干

小鬼头体育
2025-09-18 15:10:53
蒋纬国去世后,宋美龄看完账单当场沉默:养子81年,竟欠一身债

蒋纬国去世后,宋美龄看完账单当场沉默:养子81年,竟欠一身债

老范谈史
2025-11-03 17:09:56
白天陪玩晚上陪睡?明码标价8000一次!高端伴游沦为色情交易温床

白天陪玩晚上陪睡?明码标价8000一次!高端伴游沦为色情交易温床

阿纂看事
2025-08-29 15:46:57
物理竞赛前50无一女生入围,家长叹息:生女儿还是别走这条路了

物理竞赛前50无一女生入围,家长叹息:生女儿还是别走这条路了

熙熙说教
2025-11-03 17:05:20
布伦森31分吉迪23+12+12 尼克斯终结公牛五连胜

布伦森31分吉迪23+12+12 尼克斯终结公牛五连胜

北青网-北京青年报
2025-11-03 10:47:03
11月1日起:土地承包一夜大改?土地归并定了!一次性补贴打卡?

11月1日起:土地承包一夜大改?土地归并定了!一次性补贴打卡?

李博世财经
2025-11-02 11:21:40
长得丑演技也烂,脸上写满“关系户”的5位演员,看着就让人心烦

长得丑演技也烂,脸上写满“关系户”的5位演员,看着就让人心烦

淼犇小牛
2025-10-08 15:45:03
陪玩变陪睡?高端伴游实则是下流交易?

陪玩变陪睡?高端伴游实则是下流交易?

黯泉
2025-11-03 14:45:40
2025-11-04 00:36:49
头号AI玩家 incentive-icons
头号AI玩家
做内容从业者关心的AI研究
356文章数 18关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

57名储户在银行大厅受骗损失千万本金 当地成立调查组

头条要闻

57名储户在银行大厅受骗损失千万本金 当地成立调查组

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

男导演曝丑闻 蒋欣的含金量还在上升

财经要闻

最新省市GDP:谁在飙升,谁掉队了?

汽车要闻

环比增长28.7% 方程豹品牌10月销量31052辆

态度原创

艺术
时尚
数码
房产
军事航空

艺术要闻

90后跨国夫妻,到浙江山居:花20万租20年,值了!

这些才是适合普通人的穿搭!多穿基础款和半身裙,简约又得体

数码要闻

苹果邀请英国iPad用户共创“圣诞树”,获奖作品将在伦敦总部点亮

房产要闻

信达·繁花里 | 老照片征集活动 温情启幕

军事要闻

美总统威胁对尼日利亚动武 尼方回应

无障碍浏览 进入关怀版