AI 大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就。语音 AI(Speech AI)技术已经广泛应用在数字人、实时翻译、语音搜索、客户服务应答等多个业务场景, NVIDIA 也在不断通过业界领先的技术,帮助企业能够快速部署定制化 AI 智能语音端到端流程。
2023 年 12 月 19 日和 21 日晚间,来自 NVIDIA 和 Kaldi 项目的技术专家将做客Datafun 社区直播间,为您介绍如何有针对性的在语音模型的训练、推理、部署全流程中进行加速和优化,内容精彩纷呈干货满满,不要错过!
2023 年 12 月 19 日 19:30 – 21:10
在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练
NVIDIA NeMo是一个针对 ASR、NLP、TTS 的训练工具框架。它内部集成业界最新的模型结构,高效的 LLM 模型并行训练方法,方便开发者快速开发对话式 AI 应用。通过本次演讲,您将收获以下内容:
- 了解 NeMo 中新增加的模型结构。
- 了解NeMo Megatron对 LLM 的训练优化。
- 了解 NeMo 中的 TTS 模型支持。
演讲嘉宾:
齐家兴,NVIDIA 解决方案架构师
德国亚琛工业大学博士,目前于 NVIDIA 企业解决方案部门担任高级架构师,多年来从事自然语言处理和语音识别等方向研究,助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是 NVIDIA NeMo,Riva 语音识别训练推理平台的中文模型开发者之一。
利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速
NVIDIA Riva提供基于 GPU 的高效流式语音识别和语音合成的部署解决方案。通过本次演讲您将收获以下内容:
- 了解 Riva 中文语音识别新增功能。
- 了解 Riva 构建中文语音合成流程。
- 如何使用 Riva quick start 快速搭建语音服务。
演讲嘉宾:
丁文,NVIDIA 解决方案架构师
毕业于上海交通大学,导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门,主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA,负责 Riva 中文 ASR 模型迭代,中文 ASR 模型 GPU 部署方案落地与优化等。
2023 年 12 月 21 日 19:30 – 21:10
利用 NVIDIA 最新推出的 TensorRT-LLM,以及 Triton 推理服务器优化、部署和高效运行语音模型
- GPU 优化智能语音任务进展概览。
- 基于TensorRT-LLM加速 ASR 大模型。
- 基于TensorRT + Triton的流式 TTS 优化方案。
演讲嘉宾:
刘川,NVIDIA 解决方案架构经理
毕业于南京大学,目前整体负责云计算行业 GPU 解决方案的构建。NVIDIA 中文语音解决方案主要负责人,对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。
新一代 Kaldi 团队的最新进展
新一代 Kaldi 项目介绍、新一代 Kaldi 项目最新进展,以及新一代 Kaldi 中基于 GPU 的语音识别实践。
演讲嘉宾:
杨笑宇
小米公司新一代 Kaldi 项目(Daniel Povey 团队)核心开发成员。硕士毕业于剑桥大学,导师为 Phil Woodland 教授。主要研究方向为语音识别。
参与有奖!
所有注册并参加本次线上研讨会的开发者,均有机会在直播期间赢取 NVIDIA 限量版积木。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.