网易首页 > 网易号 > 正文 申请入驻

阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了

0
分享至


机器之心报道

机器之心编辑部

从通义千问到通义听悟的发布,间隔只不到两个月。

阿里用自己的大模型,给 AI 生产力工具来了一次大升级。

今天上午,「通义」家族迎来了新成员 —— 阿里云旗下的 AI 会议助理产品「听悟」全新升级为「通义听悟」,依托通义千问语言模型、音视频 AI 模型能力,为用户带来音频和视频内容记录和阅读的全新体验。

官网地址:tingwu.aliyun.com

目前,「通义听悟」已上线服务网站,使用阿里云账号登录,公测期可体验所有 AI 功能。

从现场演示中可以看出,听悟融合了十多项 AI 功能。面向线上线下各种泛音视频场景,「通义听悟」提供音视频内容的实时字幕 / 转写、多语言翻译、内容理解 / 摘要,涵盖全文概要、章节速览、发言总结等高阶 AI 功能,旨在帮助用户及客户在泛音视频内容场景下提升信息生产、整理、挖掘、洞察效率。

首先是「听力好」,比如能高准确度生成会议记录、区分不同发言人;此外是「悟性高」,大模型可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。另外,大模型一键提取 PPT、针对多个音视频内容向 AI 提问、概括特定段落等功能近期也将上线。

针对一些细分场景,听悟还设置了不少「宝藏功能」:打开 Chrome 插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的「开会替身」,在静音情况下入会 AI 可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR 等群体整理访谈更高效。

通义听悟 Chrome 插件将在近期对所有用户开放下载。

据阿里云智能首席技术官周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代工业级语音识别模型,识别准确率在多个权威中文数据集上名列第一;融合自研语音语义多模态说话人算法,能对 10 人以上说话场景进行角色区分;接入通义千问大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。

具体到玩法,正如「通义听悟」的「自我介绍」中所说:

  • 如果你是一名职场人士,通义听悟可以帮你记录和回顾你的每一场会议;
  • 如果你是一位学生朋友,通义听悟可以让你不遗漏老师讲授的每一个重点;
  • 如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈;
  • 如果你想以最快的时间看完你最喜爱的视频博主的直播分享,通义听悟可以使你以成倍的速度抓住最精彩的内容。

接下来,让我们看看「通义听悟」的本领如何。

学习效率提升利器

首先,用户可以本地上传音视频,选择转写语言并上传文件,即可生成课程文字记录。

从阿里云盘直接导入也是可以的:

通义听悟支持一键导入阿里云盘音视频文件。

据了解,公测期间注册的听悟用户后续还将获得更大的阿里云盘存储空间,在云盘内在线播放视频时也可自动出字幕。

如果用户选择在「通义听悟」中播放课程视频,还可以实现文字与视频进度一一对应。点击文字还可以跳转进度,随意切换感兴趣的内容。

此外,「通义听悟」能够帮忙总结课程关键词和议程,方便学习者了解课程要点、回顾讲解片段。

如果你想复习一下学习过程的疑点、难点,可以打开听悟实验室,开启「问题回顾」,即可回顾课程中的答疑内容。

想要快速复习要点,则可以使用「只看标记」功能,筛选高亮内容,复习更高效。你可以在右侧笔记中记录核心知识点,将课程原文一键摘取至笔记中。几小时的课程,五分钟即可完成笔记。再使用分享功能,你可以将记录共享给其他用户,让知识流动起来。

更加高效的会议体验

面向会议日程繁多的「打工人」,「通义听悟」也新增了多项效率工具。

会议开始前,打开「开启实时记录」功能,可以将沟通内容实时转文字,完整记录会议信息。

编辑标题,在右侧笔记中输入会议待讨论事项。

在会议进行过程中,你可以修改识别结果,边听边记录,无需二次整理;也可以编辑发言人,将经常一起开会的同事设为常用发言人,后续会议无需再次输入。

跨国会议中,可以开启翻译,支持双语对照和纯译文显示,沟通更顺畅。

会议结束后,点击结束录音按钮,选择本次会议发言人数并确认,「通义听悟」即可生成记录。不仅会总结关键词和议程,还能自动区分不同发言人,帮助快速掌握会议要点。

此时,打开听悟实验室,即可查看值得关注的要点、待办事项,一键跳转至原文中,回顾会变得更高效。

「通义听悟」有哪些关键技术?

此次听悟上线测试的信息摘要等能力,是以通义千问大模型为基座,并融合了团队在推理、对齐和对话问答等方向的持续研究成果。

「通义听悟」背后的「通义千问」,对关注 AI 领域的人来说并不陌生。从 2019 年开始,阿里就开始了大模型的研究,先后推出了被称为中文版 GPT-3 的中文大语言模型 PLUG,以及全球首个 10 万亿参数的多模态大模型 M6。「通义」是阿里达摩院 2022 年 9 月发布的大模型系列,且通过魔搭社区开源开放。

基于这些研究成果,今年 4 月 7 日,阿里正式发布了自研类 ChatGPT 产品「通义千问」。在技术落地上,「通义」也在不断加速。近期,阿里云通义千问等大模型已接入钉钉斜杠「/」。

此外,听悟还内置了阿里新一代工业级语音识别模型 Paraformer。Paraformer 是阿里达摩院去年 12 月发布的下一代「杀手锏」级别的语音识别基础模型,且是业界首个应用落地的非自回归端到端语音识别模型,在推理效率上最高可较传统模型提升 10 倍,识别准确率在多个权威数据集上名列第一。

同时,听悟的能力也可嵌进各类音视频平台,形成实时字幕、智能摘要等,典型应用如钉钉的「钉闪记」背后便集成了听悟。未来,全新升级后的「通义听悟」还将在夸克 APP、阿里云盘等端口提供服务。

最后,公测期间,用户可领取 100 小时以上听悟免费转写时长。如果你有需要的话,不妨上手一试?

参考链接:https://help.aliyun.com/product/454189.html

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
华为Mate之父李小龙谈Pura X Max:我最用过的最好用的双折叠

华为Mate之父李小龙谈Pura X Max:我最用过的最好用的双折叠

快科技
2026-04-13 16:49:10
日本派兵开始搞大事,人民日报向全球通告日本罪行,北约30国站台

日本派兵开始搞大事,人民日报向全球通告日本罪行,北约30国站台

傲傲讲历史
2026-04-13 23:21:05
轻薄Mini板王!OPPO Pad Mini关键配置出炉:首发骁龙8G5、8.8英寸2.5K屏

轻薄Mini板王!OPPO Pad Mini关键配置出炉:首发骁龙8G5、8.8英寸2.5K屏

快科技
2026-04-15 01:03:05
举债3.68亿、总投资超7亿,农业实训基地为何不见农业影子?

举债3.68亿、总投资超7亿,农业实训基地为何不见农业影子?

上观新闻
2026-04-14 21:54:17
婆婆在群说我懒我还没开口公公就说:她年薪两百万,你让她做饭?

婆婆在群说我懒我还没开口公公就说:她年薪两百万,你让她做饭?

小影的娱乐
2026-04-14 11:42:29
疯狂特赦!特朗普这操作把全美看傻了

疯狂特赦!特朗普这操作把全美看傻了

李荣茂
2026-04-14 18:59:59
实习律师倒贴上班,被领导在500人律师群里骂白眼狼,惹律师众怒

实习律师倒贴上班,被领导在500人律师群里骂白眼狼,惹律师众怒

汉史趣闻
2026-04-14 16:51:04
情人节撞见老婆和领导约会,我携家产离开,3年后她哭着说出真相

情人节撞见老婆和领导约会,我携家产离开,3年后她哭着说出真相

晓艾故事汇
2026-04-02 11:17:08
2011年,她全裸接受记者采访,并称:我敢看你们,你们敢看我吗?

2011年,她全裸接受记者采访,并称:我敢看你们,你们敢看我吗?

触摸史迹
2026-04-08 16:02:42
“孩子太小不会看,随便投诉,去卫健委都行!”医生怒怼家属后,儿科只剩2名医生,医院无奈停诊!

“孩子太小不会看,随便投诉,去卫健委都行!”医生怒怼家属后,儿科只剩2名医生,医院无奈停诊!

医客
2026-04-12 12:15:44
在欧尔班惨败,马扎尔获胜后,俄罗斯称匈牙利为“不友好国家”

在欧尔班惨败,马扎尔获胜后,俄罗斯称匈牙利为“不友好国家”

山河路口
2026-04-13 23:57:05
1-2大冷门+输球输人,10人曼联遭英超第15掀翻,2轮不败就此终结

1-2大冷门+输球输人,10人曼联遭英超第15掀翻,2轮不败就此终结

侧身凌空斩
2026-04-14 04:55:10
5国政要密集访华 天安门三国国旗罕见同框

5国政要密集访华 天安门三国国旗罕见同框

看看新闻Knews
2026-04-14 20:12:06
人有没有高血压看晨起就知道?高血压患者:晨起一般会有5个表现

人有没有高血压看晨起就知道?高血压患者:晨起一般会有5个表现

医学原创故事会
2026-04-14 23:56:02
迪马济奥:西蒙尼和马竞秘密签下了取消解约条款的新合同

迪马济奥:西蒙尼和马竞秘密签下了取消解约条款的新合同

懂球帝
2026-04-15 02:50:03
霍尔木兹海峡,突传大消息!特朗普,最新发声!比特币直线跳水

霍尔木兹海峡,突传大消息!特朗普,最新发声!比特币直线跳水

证券时报e公司
2026-04-11 21:48:29
砸盘了,广州某网红楼盘暴跌70%,从3.7万/平跌到1.1万/平!

砸盘了,广州某网红楼盘暴跌70%,从3.7万/平跌到1.1万/平!

黯泉
2026-04-14 21:48:49
苏林访华,为何从北京直奔雄安?核心目的是啥?背后原因浮出水面

苏林访华,为何从北京直奔雄安?核心目的是啥?背后原因浮出水面

军武咖
2026-04-14 15:22:20
广州地铁票价20年首次“动刀”提价,电鸡大军要壮大?

广州地铁票价20年首次“动刀”提价,电鸡大军要壮大?

乐居财经官方
2026-04-14 17:34:59
关善祥在许家印被逮捕的当天,不幸离世仅38岁,死亡原因令人遐想

关善祥在许家印被逮捕的当天,不幸离世仅38岁,死亡原因令人遐想

晓徙娱乐
2026-03-31 14:12:15
2026-04-15 03:11:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12762文章数 142628关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

以色列开出与伊朗停战先决条件

头条要闻

以色列开出与伊朗停战先决条件

体育要闻

带出中超最大黑马!他让球迷们“排队道歉”

娱乐要闻

网曝钟丽缇代孕要了个男孩 备孕近10年

财经要闻

许家印认罪,他和恒大还有多少欠债?

汽车要闻

售12.99万起/续航2000km 风云T9L上市

态度原创

艺术
房产
数码
时尚
手机

艺术要闻

她的水彩画竟让亿万男人倾倒,你绝对想不到!

房产要闻

改善标杆,1.5w+起横扫国兴!海口楼市,打出最猛一张牌!

数码要闻

三款小平板扎堆发布!红魔、红米、OPPO,谁会是大家的菜?

坏事做尽的疯女人,集体翻红了

手机要闻

颜值天花板!OPPO A6s Pro发布:首销1999元起 六年流畅

无障碍浏览 进入关怀版