品玩2月5日讯,据yourstory 报道印度AI初创公司Sarvam AI近日发布Sarvam Audio,一款专为应对印度多语言、语码混用及多文字体系现实而设计的语音识别系统。该系统不仅提供转录,更支持上下文感知、说话人区分(diarisation)及推理时可切换的五种输出模式,包括规范文本、罗马化输出及智能翻译等。
创始人Dr. Vivek Raghavan与Dr. Pratyush Kumar表示,Sarvam Audio旨在减少后处理,提升客服、物流、金融等场景中语音接口的生产就绪度。系统通过利用对话历史提升嘈杂环境下的识别准确率,并允许开发者按需选择输出格式,简化工程流程。
目前,Sarvam已开放在线体验平台供开发者测试不同输出风格,推动语音技术在印度大规模企业应用中的落地。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.