网易首页 > 网易号 > 正文 申请入驻

《Her》有形象了!给AI打视频电话,几乎无延迟,红杉YC投了

0
分享至

史上最快对话视频AI来了,延迟不到一秒

端到端,能听、能看、会说、有形象。

这个产品并不是出自OpenAI或HeyGen这样此前已经大展身手的公司,也没有一个具体的名字。

因为来自创业团队Tavus,因此也被称为Conversational Replicas by Tavus。

主要功能,就是搭建一个身临其境般的AI生成视频体验。

今日上线后,已经冲上Producthunt今日新品热榜第一,点赞数还在不断上升中。

Tavus官方为大家把产品特点总结了一把:

  • 延迟小于一秒
  • 现实、智能的数字孪生
  • 即插即用的端到端构建块
  • 模块化、可定制的组件,例如LLM语音合成

看得网友热血沸腾的:

好了,这下有“人”替我开ZOOM视频会议了哈哈哈哈!

也有不少网友把这视为比阅读文档or聊天更好的人机交互界面

这个会话视频界面改变了游戏规则!
我已经可以想象沉浸式体验的无限可能性。

可在网页端试玩2分钟

看到这则讯息,量子位一秒冲到了Tavus的官方网站。

在官网上,可以在线体验2分钟这个“史上最快对话视频”。

根据既有设定,体验时的对话对象是Tavus塑造的卡特

卡特的形象定位是AI视频研究公司Tavus的一名员工,以幽默的方式回应,同时很乐于助人。

就是下面这个男人:

虽然卡特是个虚拟人形象,但和他视频,就像和自己朋友视频一样。

官方建议,授权摄像头和麦克风后,和卡特聊天的时候尽量呆在一个安静的房间里。

卡特在交谈中提到,人们最喜欢跟他讨论的几个话题,除了跟他打听Tavus运用的AI技术,就是分享自己的每日心路历程,以及讲笑话。

他当场就讲了个笑话:

问,为什么自行车不能靠自己就站在那儿?
答案是,因为它too tired(Two tires)。

讲完过后,卡特自己还自己给自己捧场,哈哈了两声。

量子位也实际体验了2分钟,总体感受如下:

首先,Tavus的响应速度确实非常快,符合官方号称的“一秒以内”。

哪怕是他在说话的过程中你突然出声,卡特也能立马停下来倾听你的最新发言。

其次,虽然官方号称它支持30多种语言,但不管是用中文还是英文发问,问来问去,他都无法开口说中文

我们问他“Can u speak Chinese”时,卡特会回答:“我更愿意用英文对话呢!”

第三,Tavus的AI确实能“用眼睛看”

量子位试玩儿过程中,一度尬住,不知问什么是好,只能傻笑。

卡特立马开口:

Oh!你对我露出了一个微笑呢~

第四,在试玩版本中,卡特的口型和所说的话几乎能做到完全同步

这也就不难怪为什么有网友试玩后表示:

确实令人印象深刻,它拥有快速响应、出色的视频和音频生成能力。

现在,只要注册就可以使用Tavus的对话视频AI。

正式版本中,可供对话的AI形象就不只有卡特了,有男有女,身份设定从销售到生活指导等,应有尽有。

聊天所在的背景也能根据用户选择进行更换,不拘泥在办公室场景中。

同时,还能手动输入对话内容的上下文

可以说个性化定制程度算很高了。

目前有免费版本,也有收费形式,对应不同的生成权益。

基于自研模型开发

Tavus对话视频AI背后,是Tavus团队自研的Phoenix-2模型。

这是一个用音频和文本驱动的3D模型和2D GANs的组合,能生成1-2分钟的逼真短视频。

生成过程大致分为以下四个步骤:

TTS(文本转语音)——头部和肩部的3D重建——提示词脚本驱动的面部动画——高保真渲染。

△通过差分渲染微调面部几何细节

为了让和用户对话的AI形象更逼真,Tavus团队在构建Phoenix-2的视频渲染pipeline的时候,结合了GAN和3D高斯泼溅。

这样做的原因,是传统的GAN通常受到图像分辨率的限制,而体积模型总在时间一致性的问题上有所欠缺。

因此,Tavus想到把两者结合起来。

训练GAN时,需要大量的数据集和昂贵的计算资源,且因为其二维性质和时间一致性问题,通常推理时间和视频质量都会受限。

Tavus把3D模型作为“中间体”,实现了超过100 FPS的渲染,并且由于动态物体周围的物理感知约束,实现更高程度的可控性和通用性。

△比较2D和3D头部说话模型之间的差异

另外,Phoenix-2模型比起系列前作的改进之处,就是替换掉了初代Phoenix模型的NeRF。

转而利用3D高斯泼溅来学习引入如何驱动3D空间中的面部动态变形,并利用该信息根据看不见的音频来渲染视图。

团队成员表示,比起NeRF,3D高斯泼溅在数据、内存、计算复杂度、流程、渲染效率等方面都表现更好。

基于3D高斯泼溅的Phoenix-2模型的pipeline,能够以比初代模型快70%的速度进行训练,以60+FPS的速度进行渲染。

Tavus表示,对话过程中,有回合结束检测和可中断性,让用户感觉进行的对话更真实。

此外,由于面部信息非常敏感,团队提供安全检查、安全协议、自动内容审核和反幻觉检查来保护信息安全。

值得一提的是,Phoenix系列模型还支撑了Tavus的另一个产品——

生成用户数字孪生形象的对话视频。

只需要提供2分钟素材、花费1美元(起),就能调用API生成视频内容。

官方提示可提供端到端的解决方案,有以下能力:

  • 使用API,构建安全、真实的数字孪生或AI Agent
  • 定制LLM、对话的人物角色和背景
  • 在嵌入式会议室中流式传输对话
  • 记录、转录并分享对话
  • 通过生产级可扩展性处理高流量
“不<1s,就不是人了”

Tavus团队是一家成立四年的AI视频初创公司,规模不大。

成员大多来自Amazon、Descript、Google和Apple等。

公开资料显示,截至今年3月,该公司已经获得了红杉、Scale VC、YC的A轮投资,融资额约1800万美元。

Tavus的联合创始人兼CEO,名叫Hassaan Raza

曾在谷歌和苹果工作过。

而该公司的联合创始人兼COO在Producthunt留言表示,对话视频AI的制作花费了很长时间,研究、工程和建造大约花费了数千个小时。

至于为什么要追求1秒或者更短的延迟?

官方也给出了答案,是在尽可能模拟人类和人类的视频对话

因为如果反应速度不低于1秒,那(对面跟你聊天的)就不是人了。

参考链接:
[1]https://www.tavus.io/careers
[2]https://x.com/heytavus/status/1824075891271749903
[3]https://www.producthunt.com/posts/conversational-replicas-by-tavus

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
连克曼城、阿森纳也没用!卡里克被曝无缘红魔帅位,或转投热刺

连克曼城、阿森纳也没用!卡里克被曝无缘红魔帅位,或转投热刺

夜白侃球
2026-01-27 20:10:16
张雨绮被实名举报代孕、插足婚姻,据称已退出辽宁春晚;前夫袁巴元前妻时隔1年公布警方调查结果

张雨绮被实名举报代孕、插足婚姻,据称已退出辽宁春晚;前夫袁巴元前妻时隔1年公布警方调查结果

大风新闻
2026-01-26 09:51:06
马筱梅回应不和俩娃住,称婆婆张兰住在富人区,意外透露二月行程

马筱梅回应不和俩娃住,称婆婆张兰住在富人区,意外透露二月行程

以茶带书
2026-01-27 14:15:55
深夜利好,20家公司发布年报预增,10家增速超200%,一家增1600%

深夜利好,20家公司发布年报预增,10家增速超200%,一家增1600%

风风顺
2026-01-28 06:20:21
直降16.1℃,浙江迎来雨夹雪或雪!新冷空气即将发货,还有中雨、9级大风

直降16.1℃,浙江迎来雨夹雪或雪!新冷空气即将发货,还有中雨、9级大风

台州交通广播
2026-01-28 02:05:09
曼联争4利好!5轮3主2客+对手0强队,有望拿15分甩开切尔西利物浦

曼联争4利好!5轮3主2客+对手0强队,有望拿15分甩开切尔西利物浦

体育知多少
2026-01-28 06:10:34
重磅官宣!2026“苏超”给24家赞助商授牌,5万元就可以赞助2026“苏超”

重磅官宣!2026“苏超”给24家赞助商授牌,5万元就可以赞助2026“苏超”

扬子晚报
2026-01-27 18:22:30
张信哲:我基本不会约任何人吃饭,我的晚餐时间是属于我妈的

张信哲:我基本不会约任何人吃饭,我的晚餐时间是属于我妈的

秀语千寻
2026-01-27 14:28:52
一句“搞么哩”火遍全网!4岁重庆娃,让千万人看见家的幸福模样

一句“搞么哩”火遍全网!4岁重庆娃,让千万人看见家的幸福模样

江津融媒
2026-01-27 13:05:14
12岁玥儿穿价值7000元外套,很贵气!越长越像大S

12岁玥儿穿价值7000元外套,很贵气!越长越像大S

大眼妹妹
2026-01-27 08:40:10
斯诺克最新战报!墨菲5-1大胜进16强,囧哥3连鞭逆转,黑马2-2!

斯诺克最新战报!墨菲5-1大胜进16强,囧哥3连鞭逆转,黑马2-2!

刘姚尧的文字城堡
2026-01-28 04:56:04
重庆19层高楼炸开50米裂缝,400户寒夜逃生!这笔安全账该谁埋单

重庆19层高楼炸开50米裂缝,400户寒夜逃生!这笔安全账该谁埋单

今朝牛马
2026-01-27 21:56:05
身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆天团来了

身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆天团来了

泠泠说史
2026-01-26 14:19:11
这次军委的动作,真是让人倒吸一口凉气!

这次军委的动作,真是让人倒吸一口凉气!

百态人间
2026-01-27 15:31:38
没滤镜真可怕!秦海璐满脸沟壑,梅婷黑胖土,章子怡肿成大饼脸

没滤镜真可怕!秦海璐满脸沟壑,梅婷黑胖土,章子怡肿成大饼脸

小梊搞笑解说
2026-01-28 05:52:37
翟欣欣邻居曝猛料:她被带走时哭疯了,父母跟着落泪,称跟她无关

翟欣欣邻居曝猛料:她被带走时哭疯了,父母跟着落泪,称跟她无关

谈史论天地
2026-01-26 18:40:03
当年为何要炸掉西湖边的秋瑾墓?

当年为何要炸掉西湖边的秋瑾墓?

吕醿极限手工
2026-01-27 14:36:43
中超转会新消息:泰山、蓉城各添1名猛将,申花队放弃2000万国脚

中超转会新消息:泰山、蓉城各添1名猛将,申花队放弃2000万国脚

何老师呀
2026-01-27 22:54:17
来自川普的直接背刺

来自川普的直接背刺

西楼饮月
2026-01-27 22:41:43
1月27日俄乌最新:唐纳德,够了!

1月27日俄乌最新:唐纳德,够了!

西楼饮月
2026-01-27 20:12:59
2026-01-28 07:23:00
量子位 incentive-icons
量子位
追踪人工智能动态
12071文章数 176366关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

美报告称中国是其面对最强大国家

头条要闻

美报告称中国是其面对最强大国家

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

数码
亲子
游戏
手机
公开课

数码要闻

这事你怎么看 索尼与TCL签署意向备忘录 网友:Sony变Tony了

亲子要闻

孩子被蜜蜂蜇了!

LPL春季赛:决绝让一追二,AL三局击溃IG,大家的排名都不变

手机要闻

荣耀老旗舰焕发第二春:多款机型推送新版本,你收到了吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版