网易首页 > 网易号 > 正文 申请入驻

未来的人机交互如何落地?NVIDIA 研究团队给出了答案

0
分享至

作者 | 程茜
编辑 | 漠影

对话式人工智能(AI)这个词听起来可能有些陌生,但它其实已经渗透到了我们生活的方方面面。语音助手、智能客服、聊天机器人等都是它的应用载体,涵盖金融、交通、通信、购物等多个领域。

随着技术发展和人们生活习惯的变化,对话式 AI 也在不断改变着众多行业,随之而来,企业对于对话式 AI 部署的需求激增。然而,对话式 AI 服务在开发、部署过程中,企业往往会面临很多难题。

如何拥有数据庞大且高度精确的训练模型?如何快速部署复用?如何保障用户的数据隐私和安全?都是横亘在企业落地对话式 AI 服务面前的大山。

因此,对话式 AI 这一浪潮正在席卷各行各业的背景下,NVIDIA 研究团队通过研发、实践,不断寻找助力企业落地对话式 AI 服务的新解法。

一、对话式 AI 正在拓宽人机交互的边界

NVIDIA 创始人兼首席执行官黄仁勋曾说:“对话式 AI 是终极 AI。”可以看到,对话式 AI 的出现与普及正在彻底改变越来越多的行业,如金融、电信等以对话为主要形式的通信即服务行业(UCaaS)。再加上新冠疫情暴发以来,灵活多变的混合办公模式兴起,线上场景下的对话需求越来越多,使得对话式 AI 的重要性逐渐凸显,但在人机交互的部署和实际效果上,企业仍面临许多难题。

首先,企业想要对话式 AI 的效果能够更加自然,就需要高度精确、经过预训练的模型和迁移学习,并且,“实时性”也是用户体验自然的一个关键因素,大多数人会在 100~120 毫秒左右感知到明显的通信滞后,因此实时交互需要精确到 100 毫秒以内。

其次,对于需要广泛部署对话式 AI 服务的企业来说,它们需要混合使用云、内部部署和边缘部署,并且将系统支持扩展到数十万并发用户中,这对于企业而言仍是一大难题。举例而言,平安科技原有的传统模式是单个服务器部署模型,但在实际场景下,每个智能客服的通话数量会发生变化,无法与业务需求量同步并进行资源调配,就使得部分业务空闲导致 GPU 资源浪费。

最后,备受用户的数据隐私和安全问题也是对话式 AI 开发的难点之一,例如在本地或可信任的云中进行安全数据处理。

即便有这些难题,但对话式 AI 正在席卷各行各业的浪潮不可阻挡。

二、端到端模型工具,GPU 加速运行

应用而生的NVIDIA 对话式 AI 架构 Riva,在解决上述难题时,就能为开发者提供经过预先训练的先进深度学习模型和软件工具,快速、高效地将算法模型应用到更多业务场景中,帮助企业创建面向不同行业的对话式 AI 服务。

Riva 采用了语音的端到端工作流,与传统语音识别系统不同,其只分为输入端的语音特征和输出端文本信息。

在语音和文字转化方面,Riva 包含自动语音识别(Automatic Speech Recognition,ASR)和文字转语音(Text to Speech,TTS)。

首先,Riva 提供的自动语音识别软件工具,可以针对不同领域或部署平台进行定制。

其次,Riva 拥有使用频谱图生成和声码器模型的类人文本转语音神经语音,并且其管道可以进行定制和优化,在 GPU 上实时高效运行。利用文字转语音工具,用户将原始文本输入,在流模式下生成音频块后立即返回,也可以在批处理模式下在整个序列结束时返回。

Riva 从模型到软件再到硬件全堆栈持续优化提供的增益是上一代产品的 12 倍,基于此,企业可以进一步提高自己对话式 AI 系统的准确性以及快速部署能力。

三、快速部署+优质效果,下载量已超25万次

作为企业满足对话式 AI 服务的有力武器,Riva 在帮助企业提高部署效率和服务效果中拥有以下几大优势:

1、预训练模型:十亿文本+六万小时语音数据

对话式 AI 往往需要高度精确、准确的训练文本,帮助 AI 理解文字和语音的意思。

Riva 提供的预训练模型,经过十亿多页的文本、六万小时的语音数据训练,并且还接受了不同的语言、口音、专业术语和环境上数百万个小时的 GPU 训练,这保证了其预训练模型的准确性。

2、实时交互:100 毫秒内轻松响应

在对话中,想要更加自然真实,低延时、实时交互是其中的关键。Riva 借助 GPU 加速,使得端到端语音流程运行时间可达到 100 毫秒内,也就是包括听、理解和生成响应在内的全流程速度,而正常人眨眼时间为 0.2~0.4 秒左右。

此外,Riva 还借助了适用于低延迟和高吞吐量通信的 gRPC 的微服务器,能够进一步减少识别时间。

3、拿来即用:几行代码就可成功部署

开发者在部署 Riva 时可使用 NVIDIA TAO 工具包,对不同行业、任务、系统的模型训练、适配和优化,并且还能使用自己的数据对模型进行微调,使其在实际场景中提供实时语音服务时能达到更稳定的效果。

值得一提的是,在部署 Riva 时,开发者不需要深度 AI 专业知识,只需要几行代码就可以成功部署模型。与此同时,Riva 还整合了 ASR、TTS、NLP(自然语言处理)三个智能算法引擎,使得企业的对话式 AI 服务能在技术底层上实现统一。

4、定制服务:不同专业+个性声音均可实现

不同于我们日常交流中常用的词语、句子,专业性较强的对话式 AI 就需要特定训练,才能与相关专业进行适配。Riva 自动语音识别管道就针对不同行业、领域的数据进行了训练,帮助企业进行个性化定制,并快速复用到实际应用场景中。

为了提高对话式 AI 服务的表现力,2021 年 9 月,Riva 还推出了定制语音功能,可以帮助企业在一天之内打造类似真人的定制语音,该功能支持微调口音、音高、声音细粒度等,Riva 2.0 也已于 2022 年 3 月已上线。

Riva 从 2020 年 5 月发布以来,截至 2021 年 9 月,已实现 25 万次以上的下载量,并广泛应用于视频会议、聊天机器人等场景。现在点击文末“阅读原文”就可以试用Riva的互动式Demo。

四、结语:掀起企业对话式 AI 应用落地潮

人工智能技术发展正在改变很多行业,对话式 AI 正在一些场景下取代人工客服,并且随着语音识别、语义理解等技术的发展,语音 AI 已经从“傻瓜式”、“机器人式”变得更加智能化,未来,更自然的人机对话可能会很快实现。

作为 NVIDIA 研究团队的重要成果之一,Riva 帮助企业构建可定制的对话式 AI 应用程序,将掀起对话式 AI 应用落地的浪潮。不仅如此,NVIDIA 的研究团队也在不断探索 AI 等前沿科技的新应用场景,在加快前沿技术落地的同时,为更多场景应用提供底层技术支持。

之后,我们还将陆续介绍 NVIDIA 研究团队推出的计算机视觉、深度学习模型以及有意思的交互式Demo,如 NVIDIA Audio2Face:仅需一个音频来源即可快速生成表情丰富的面部动画;NVIDIA Canvas:使用 AI 将简单的笔触变成逼真的风景图等。体验更多人工智能和深度学习互动 Demo,请复制https://t.cn/A6aDExGB到浏览器打开“NVIDIA AI 广场”。

声明:本文与 NVIDIA 产品相关的图片,版权均归 NVIDIA Corporation 所有。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
南通车祸已造成一名学生死亡?路人自发救援,将孩子抬出大巴车

南通车祸已造成一名学生死亡?路人自发救援,将孩子抬出大巴车

社会酱
2024-05-11 15:36:16
福州、泉州最新人事任免

福州、泉州最新人事任免

鲁中晨报
2024-05-11 21:55:05
璩静离职内幕:惹怒老板娘被开除,李彦宏很生气,内部聊天曝光

璩静离职内幕:惹怒老板娘被开除,李彦宏很生气,内部聊天曝光

180°视角
2024-05-10 12:45:43
沙特大满贯赛:陈梦打疯了!4-2逆转孙颖莎夺冠,连赢中日4大主力

沙特大满贯赛:陈梦打疯了!4-2逆转孙颖莎夺冠,连赢中日4大主力

全言作品
2024-05-11 20:00:21
外媒:加沙哈马斯领导人下落成谜

外媒:加沙哈马斯领导人下落成谜

参考消息
2024-05-11 22:00:14
皇马2大巨变!曝将清洗金球奖巨星,6月初官宣姆巴佩,穿10号

皇马2大巨变!曝将清洗金球奖巨星,6月初官宣姆巴佩,穿10号

足球慢镜头
2024-05-11 17:37:38
那英大战八国联军,网友急呼凤凰传奇停止巡演,速来救场

那英大战八国联军,网友急呼凤凰传奇停止巡演,速来救场

毒舌说历史1
2024-05-11 17:02:48
艳星反击特朗普律师:我拍了150部成人电影,但看到特朗普穿睡衣就不适

艳星反击特朗普律师:我拍了150部成人电影,但看到特朗普穿睡衣就不适

娱乐八卦木木子
2024-05-11 06:03:34
凯特王妃近照曝光,头发剪短气色变好,与威廉王子一起露面

凯特王妃近照曝光,头发剪短气色变好,与威廉王子一起露面

小seven的囧囧啊
2024-05-11 18:01:58
德媒:中国助力匈牙利赶超德国,成欧洲领先电动汽车产地

德媒:中国助力匈牙利赶超德国,成欧洲领先电动汽车产地

青木在德国
2024-05-11 22:00:15
大胆穿搭!Kanye和妻子今日的OOTD!

大胆穿搭!Kanye和妻子今日的OOTD!

SwagFuck
2024-04-05 17:16:48
外交部多位高层领导履新

外交部多位高层领导履新

直新闻
2024-05-11 18:11:42
2-1!山东泰山上演大逆转,艾菲尔丁血洒赛场,23岁小将1射1传

2-1!山东泰山上演大逆转,艾菲尔丁血洒赛场,23岁小将1射1传

汪星人哟
2024-05-11 21:36:23
28分钟4中0+6犯规!广东00后前锋梦游一战:他还有培养价值吗?

28分钟4中0+6犯规!广东00后前锋梦游一战:他还有培养价值吗?

狼叔评论
2024-05-11 23:16:04
皇马10号易主记者:姆巴佩将穿皇马10号,魔笛今夏铁定离队

皇马10号易主记者:姆巴佩将穿皇马10号,魔笛今夏铁定离队

直播吧
2024-05-11 17:23:12
300万亿!钱去哪了?央视给出了解释!

300万亿!钱去哪了?央视给出了解释!

牲产队2024
2024-05-11 22:15:41
遇见传奇!勇士官方晒出库明加与足坛名宿齐达内的合影

遇见传奇!勇士官方晒出库明加与足坛名宿齐达内的合影

直播吧
2024-05-12 07:34:23
一夜之间,美大选再次反转!下任总统板上钉钉?特朗普突喊话中国

一夜之间,美大选再次反转!下任总统板上钉钉?特朗普突喊话中国

星辰故事屋
2024-05-11 21:08:43
又反转了!5月11日魏嘉再次发文,自曝7大瓜,这女人果然不简单呀

又反转了!5月11日魏嘉再次发文,自曝7大瓜,这女人果然不简单呀

娱乐圈酸柠檬
2024-05-12 04:37:50
讽刺拉满!赛后辽宁球迷仍猴子庆祝比赛胜利

讽刺拉满!赛后辽宁球迷仍猴子庆祝比赛胜利

懂球帝
2024-05-11 22:22:16
2024-05-12 07:48:49
智东西
智东西
聚焦智能变革,服务产业升级。
8510文章数 116465关注度
往期回顾 全部

科技要闻

苹果高管体验ChatGPT后恐惧,砍掉汽车项目

头条要闻

耶伦遭质问:有没有可能 美国在一些领域被中国打败了

头条要闻

耶伦遭质问:有没有可能 美国在一些领域被中国打败了

体育要闻

独行侠擒雷霆总分2-1!东欧44+20+12

娱乐要闻

《歌手2024》首播排名出了,那英第三

财经要闻

周鸿祎的放贷生意:为金融机构兜底催债

汽车要闻

e平台3.0 Evo首款车型 海狮07EV有啥不同

态度原创

旅游
艺术
手机
游戏
军事航空

旅游要闻

中国的普罗旺斯,我提名这里

艺术要闻

因聚生变 以聚求变——上苑艺术馆2024国际创作计划开幕展“艺聚变”

手机要闻

消息称苹果与三星达成协议 为其可折叠设备供应显示屏

魂师对决:缔约自选卡池抽取分析!这种加强操作永远让人看不懂!

军事要闻

驻印大使徐飞洪:中印两军边界西段4点位实现脱离接触

无障碍浏览 进入关怀版