网易首页 > 网易号 > 正文 申请入驻

AI学会了讲上海话,沪语大模型“小沪”首发,集钱乃荣等方言专家听说读语料

0
分享至

摘要:“小沪”应用场景和领域将不断拓展,社会服务功能持续增强,可以广泛用于沪语AI助手——助老语音服务

“小沪、小沪,我最近肚皮不太适宜,哪能办?”一位年长的“爷叔”用上海话发问。

“侬最好问问医生,看看消化科,中山医院蛮好呃……”智能体“小沪”用女声的上海话建议。

“哦,中山医院哪能走啊?”“从上海大学,乘7号线,东安路站头下来,大概一个钟头。”

9日,被命名为“小沪”的沪语大模型让AI学会了讲上海话,在上海大学首发。作为上大打造数字城市上海“繁花”大模型的组成部分,这一带有卡通数字人形象的智能体,基于钱乃荣等方言专家“听说读”大量语料,由上大文学院中文学科团队开发而成。

在语言模型实验中,来自南美洲的一位上海大学留学生,与屏幕上的“小沪”数字人对话。他使用英语向“小沪”咨询,到上海游玩应该先去哪儿。“小沪”利用跨语言交际能力作答,“侬可以去外滩,夜景相当好,旁边豫园人老多,蛮闹忙……”不仅如此,“小沪”告诉他,如果有时间,上海乃至中国好玩的地方还很多。

“上海话既蕴含吴语方言的古音,又包括流行至今的音译词。”作为长期致力于上海话推广的朗诵专家,上大副教授丁迪蒙表示,身在这座国际化大都市,通过AI大模型保护和开发沪语,可实现沪语作为上海城市文化更新与文明实践的基础性设施地位和功能。

著名语言学家、上海话研究专家钱乃容教授编撰了《上海话大辞典》,发明了上海话输入法。作为上海话研究重镇,以“上海”城市命名的上大长期以来积累了这样最优质最丰富的沪语语料。同时,大学配备了实验语音学实验室、AI集成与部署专家,正集中学科优势攻关地方特色的方言大模型。

解放日报·上观新闻记者了解到,“小沪”是一套整合了语音识别,大语言模型文字生成,以及语音合成三方面功能的交互式AI系统。目前在1.0版本阶段专注听、说、读,能够开展沪语朗读沪语,沪语朗读普通话,普通话—沪语自由对话等。经过质量测试,“小沪”的朗读能力已经可以与丁迪蒙这样的行业带头人并肩。

据上海大学党委常委、宣传部部长曾军教授介绍,经迭代开发,2.0版本的“小沪”将实现沪语与沪语之间的自由交流,并开发男生沪语、童声沪语等不同性别和年龄的沪语版本。而3.0版本的“小沪”则依托沪语读写能力开发及应用,并增加歌唱和表演功能。

可以预见,随着AI技术不断升级,“小沪”应用场景和领域将不断拓展,社会服务功能持续增强,可以广泛用于沪语AI助手——助老语音服务,以及沪语主播、沪语语伴、沪语客服与沪语教学平台,乃至电台电视台的沪语—普通话、外语互转互译等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

上观新闻 incentive-icons
上观新闻
站上海,观天下
461747文章数 760550关注度
往期回顾 全部

专题推荐

洞天福地 花海毕节 山水馈赠里的“诗与远方

无障碍浏览 进入关怀版